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(57) Abstract: The invention relates to a method for producing carotenoids or their precursors using genetically modified organ- 
isms of the BLakeslea genus. Said method comprises the following steps (i) transformation of at least one of the cells, (ii) optional 
homokaryotie conversion of the cells obtained in step (i) to produce cells, in which one or more genetic characteristics of the nucleii 
are all modified in an identical manner and said modification manifests itself in the cells, (iii) selection and reproduction of the 
genetically modified cell or cells, (iv) cultivation of the genetically modified cells, (v) preparation of the carotenoids produced by 
the genetically modified cells or the carotenoid precursor produced by said genetically modified cells. The invention also relates to 
carotenoids or their precursors produced according to said method and to the use thereof 
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(57) Zusammeniassung: Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen mittels gentechnisch veranderter Orga- 
nismen der Gattung Blaheslea umfassend (i) (i) Transformation mindestens einer der Zellen, (ii) ggf. Homokaryotisierung der aus 
(i) erhaltenen Zellen, so dass Zellen entstehen, in denen die Kerne in einem oder in mehreren genetischen Merkmalen alle gleichar- 
tig verandert sind und diese genetische Veranderung zur Auspragung bringen, und (ix) Selektion und Vermehrung der gentechnisch 
veranderten Zelle oder Zellen, (x) Kultivierung der gentechnisch veranderten Zellen, (xi) Bereitstellung des von den gentechnisch 
veranderten Zellen produzierten Carotinoids oder der von den gentechnischen veranderten Zellen produzierten Carotinoidvorstufe; 
nach dem Verfahren hergestellte Carotinoide oder deren Vorstufen und deren Verwendung. 
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Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen 
mittels gentechnisch veranderter Orqanismen der Gattunq Blakes- 
lea, mit dem Verfahren hergestellte Carotinoide oder deren Vorstufen 

und deren Verwendung 

5 

Die Erfindung betrifft ein Verfahren zur Herstellung von Carotinoiden oder 
deren Vorstufen mittels gentechnisch veranderten Organismen der Gat- 
tung Blakeslea, mit dem Verfahren hergestellte Carotinoide oder deren 
Vorstufen und deren Verwendung und Bereitstellung, besonders als hoch- 
reine. Carotinoide, als Nahrungsmittel, enthaltend Carotinoide- 
produzierende Organismen und mindestens ein Carotinoid, insbesondere 
Tierfuttermittel, Tierfuttererganzungsmittel und Nahrungserganzungsmittel, 
sowie die Verwendung der aus dem Verfahren erhaltlichen Carotinoide zur 
Herstellung von kosmetischen, pharmazeutischen, dermatologischen Zu- 
bereitungen, Nahrungsmitteln oder Nahrungserganzungsmitteln. 

Blakeslea trispora ist als Produktionsorganismus fur p-Carotin (Ciegler, 
1965, Adv Appl Microbiol. 7:1) und Lycopin bekannt (EP 1201762, EP 
1184464, WO 03/038064). 
20 

Von Blakeslea trispora sind bisher verschiedene DNA-Sequenzen be- 
kannt, insbesondere die DNA-Sequenz, die fur die Gene der Carotinoid- 
biosynthese von Geranylgeranylpyrophosphat bis p-Carotin codiert (WO 
03/027293). 

25 

Insbesondere aufgrund der hohen Produktivitat, die mit Blakeslea in der 
Produktion von Lycopin und p-Carotin erreicht werden, bietet sich dieser 
Organismus zur fermentativen Herstellung von Carotinoiden an. 

30 Es ist auch von Interesse die Produktivitaten der bisher naturlicherweise 
produzierten Carotine und deren Vorstufen weiter zu steigern und die Her- 
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stellung weiterer Carotinoide, wie z. B. Xanthophylle zu ermoglichen, die 
von Blakeslea bisher nicht oder nur in sehr geringem Made gebildet und 
isoliert werden konnen. 

5 Carotinoide werden Futtermitteln, Nahrungsmitteln, Nahrungsergan- 
zungsmitteln, Kosmetika und Arzneimitteln zugesetzt. Die Carotinoide die- 
nen vor allem als Pigmente zur Farbung. Daneben werden die antioxidati- 
ve Wirkung der Carotinoide und andere Eigenschaften dieser Substanzen 
genutzt. Man unterteilt die Carotinoide in die reinen Kohlenwasserstoffe, 

10 die Carotine und die sauerstoffhaltigen Kohlenwasserstoffe, die Xantho- 
phylle. Xanthophylle wie Canthaxanthin und Astaxanthin werden bei- 
spielsweise zur Pigmentierung von Huhnereiem und Fischen eingesetzt 
(Britton et al. 1998, Carotinoids, Vol 3, Biosynthesis and Metabolism). Die 
Carotine P-Carotin und Lycopin werden vor allem in der Humanernahrung 

15 eingesetzt. (3-Carotin wird beispielsweise als Getrankefarbstoff verwendet. 
Lycopin hat eine krankheitsvorbeugende Wirkung (Argwal und Rao, 2000, 
CMAJ 163:739-744; Rao und Argwal 1999, Nutrition Research 19:305- 
323). Die farblose Carotinoidvorstufe Phytoen kommt vor allem fur An- 
wendungen als Antioxidans in kosmetischen, pharmazeutischen oder 

20 dermatologischen Zubereitungen in Frage. 

Der uberwiegende Teil der Carotinoide und deren Vorstufen, die als Zu- 
satzstoffe fur die oben genannten Anwendungen eingesetzt werden, wird 
durch chemische Synthese hergestellt. Die chemische Synthese ist tech- 

25 nisch sehr aufwendig und verursacht hohe Herstellkosten. Fermentative 
Verfahren sind demgegenuber technisch verhaltnismaiSig einfach und ba- 
sieren auf kostengiinstigen Einsatzstoffen. Fermentative Verfahren zur 
Herstellung von Carotinoiden und deren Vorstufen konnen dann 
wirtschaftlich attraktiv und wettbewerbsfahig zur chemischen Synthese 

30 sein, wenn die Prod uktivitat der bisherigen fermentativen Verfahren 
gesteigert wurde oder neue Carotinoide auf Basis der bekannten 
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wiirde oder neue Carotinoide auf Basis der bekannten Produktionsorga- 
nismen hergestellt werden konnten. 

Hierzu ist eine gentechnische, d. h. gezielte genetische Veranderung von 
5 Blakeslea erforderlich. Insbesondere, wenn Xanthophylle produziert wer- 
den sollen, da diese Verbindungen naturlicherweise vom Wildtyp der Bla- 
keslea nicht synthetisiert werden. 

Z. B. zur Herstellung von Phytoen mittels Fermentation von Blakesles 
w trispora sind bisher zwei Methoden bekannt: 

(i) Durch zufallsabhangige Mutagenese mit chemischen Agenzien 
wie MNNG konnen Mutanten erzeugt werden, in denen Phytoen 
nicht zu Lycopin und somit nicht weiter zu B-Carotin umgesetzt 
werden kann (Mehta und Cerda-Olmedo, 1995, Appl. Microbiol. 

15 Biotechnol. 42:836-838). 

(ii) Durch Zugabe von Inhibitoren des Enzyms Phytoendesaturase 
wie z.B. Diphenylamin und Zimtalkohol kann die weitere Umsetzung 
von Phytoen blockiert werden, so dass es sich anreichert (Cerda- 

20 Olmedo, 1989, In: E. Vandamme, ed. Biotechnoiogy of vitamin, 

growth factorand pigment production. London: Eisevier Applied Sci- 
ence, S. 27-42). 

Die genannten Methoden zur Herstellung von Phytoen mit Blakeslea 
25 trispora weisen jedoch eine Reihe von Nachteilen auf. 

Die zufallsabhangie Mutagenese betrifft in der Regel nicht nur die Gene 
der Carotinoidbiosynthese zur weiteren Umsetzung von Phytoen, sondern 
auch weitere wichtige Gene. Daher sind Wachstum und Syntheseleistung 
30 der Mutanten oft beeintrachtigt. Die Erzeugung z. B. von PhytoenQberpro- 
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duzenten durch zufallsabhangige Mutagenese von Lycopinuberproduzen- 
ten Oder (J-Carotinuberproduzenten ist daher entweder nicht oder nur mit 
groliem experimentellem Aufwand zu erreichen. Die Zugabe von Inhibito- 
ren verursacht eine ErhOhung der Produktionskosten und gegebenenfalls 
5 ej ne Verunreinigung des Produktes. Daneben kann das Zellwachstum 
durch den Inhibitor beeintrachtigt werden, so dass die Produktion von Ca- 
rotinoiden oder deren Vorstufen, insbesondere Phytpen eingeschrankt 
wird. 

10 Durch eine gentechnische Veranderung konnten die oben genannten 
Nachteile der zufallsabhangigen Mutagenese und der Inhibitorzugabe 
vermieden werden. 

15 Allerdings sind bisher keine Methoden zur gentechnischen, d. h. gezielten 
gentechnischen Veranderung von Blakeslea, insbesondere Blakeslea 
trispora bekannt. 

Als Methode zur Herstellung von gentechnisch veranderten Pilzen wurde 
20 in einigen Fallen die Agrobacterium-vermittelte Transformation erfolgreich 
eingesetzt. So sind z. B. folgende Organismen durch Agrobakterien trans- 
formiert worden: Saccharomyces cerevisiae (Bundock et al., 1995, EMBO 
Journal, 14:3206-3214), Aspergillus awamori, Aspergillus nidulans, 
Aspergillus niger, Colletotrichum gloeosporioides, Fusarium solani pisi, 
25 Neurospora crassa, Trichoderma reesei, Pleurotus ostreatus, Fusarium 
graminearum (van der Toorren et al., 1997, EP 870835), Agraricus bispo- 
rus, Fusarium venenatum (de Groot et al., 1998, Nature Biotechnol. 
16:839-842), Mycosphaerella graminicola (Zwiers et al. 2001, Curr. Ge- 
net. 39:388-393), Glarea lozoyensis (Zhang et al., 2003, Mol. Gen. Ge- 
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nomics 268:645-655), Mucor miehei (Monfort et al. 2003, FEMS Microbio- 
logy Lett. 244:101 - 106). 

Von Interesse ist besonders eine homologe Rekombination, bei der zwi- 
5 schen der einzufuhrenden DNA und der Zell-DNA moglichst viele Se- 
quenzhomologien bestehen, so dass eine ortsspezifische Einfuhrung bzw. 
Ausschaltung von genetischer Information im Genom des Empfangeror- 
ganismus moglich ist. Andernfalls wird die Spender-DNA durch iilegitime 
bzw. nicht-homologe Rekombination ins Genom des Ernpfangerorganis- 
10 mus integriert, was nicht ortsspezifisch erfolgt. 

Eine durch Agrobacterium vermittelte Transformation und anschlieliende 
homologe Rekombination der transferierten DNA wurde bisher bei folgen- 
den Organismen nachgewiesen: Aspergillus awamori (Gouka et al. 1999, 
15 Nature Biotech 17:598-601), Glarea lozoyensis (Zhang et al., 2003, Mol. 
Gen. Genomics 268:645-655), Mycosphaerella graminicola ((Zwiers et al. 
2001, Curr. Genet. 39:388-393). 

Als weitere Methode zur Transformation von Pilzen ist die Elektroporation 
20 bekannt. Die integrative Transformation von Hefe durch Elektroporation 
wurde von Hill, Nucl. Acids. Res. 17:8011 gezeigt. Fur filamentose Pilze 
wurde die Transformation durch Chakaborty und Kapoor beschrieben 
(1990, Nucl. Acids. Res. 18:6737)! 

25 Eine „biolistische" Methode, d.h. die Obertragung von DNA durch Be- 
schuss von Zellen mit DNA-beladenen Partikeln wurde beispielsweise fur 
Trichoderma harzianum und Gliocladium virens beschrieben (Lorito et al. 
1993, Curr. Genet. 24:349-356). 
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Diese Methoden konnten bisher jedoch nicht erfolgreich zur gezielten ge- 
netischen Veranderung von Blakeslea und insbesondere Blakeslea trispo- 
ra. eingesetzt werden. 

5 Eine besondere Schwierigkeit bei der Herstellung von gentechnisch ver- 
Snderten Blakeslea und Blakeslea trispora, ist die Tatsache, dass deren 
Zellen in alien Stadien des sexuellen und des vegetativen Zellzyklus 
mehrkernig sind. In Sporen von Blakeslea trispora Stamm NRRL2456 und 
NRRL2457 wurden z. B. im Durchschnitt 4,5 Kerne pro Spore nachgewie- 
10 sen (Metha und Cerda-Olmedo, 1995, Appl. Microbiol. Biotechnol. 42:836- 
838). Dies hat zur Folge, dass die gentechnische Veranderung in aller 
Regel nur in einem oder wenigen Kernen vorliegt, die Zellen also hetero- 
karyotisch sind. 

15 Sollen die genetisch veranderten Blakeslea, insbesondere Blakeslea 
trispora zur Produktion eingesetzt werden, so ist es insbesondere bei einer 
Gendeletion wichtig, dass in den Produktionsstammen die gentechnische 
Veranderung in alien Kernen vorliegt, so dass eine stabile und hohe Syn- 
theseleistung ohne Nebenprodukte moglich wird. Die Stamme mQssen 

20 folglich in Bezug auf die gentechnische Veranderung homokaryotisch sein. 

Lediglich fur Phycomyces blakesieeanus ist ein Verfahren beschrieben 
worden, urn homokaryotische Zellen zu erzeugen (Roncero et al., 1984, 
Mutat. Res. 125:195). Durch Zugabe des mutagenen Agens MNNG (N- 

25 Methyl-N'-nitro-N-nitrosoguanidin) werden nach dem dort beschriebenen 
Verfahren Kerne in den Zellen eliminiert, so dass statistisch eine gewisse 
Anzahl von Zellen mit nur noch einem funktionellem Kern vorliegt. Die Zel- 
len werden dann einer Selektion unterzogen, in der nur einkernige Zellen 
mit einem rezessiven Selektionsmarker zu einem Mycel auswachsen kon- 

30 nen. Die Nachkommen dieser selektierten Zellen sind mehrkernig und 
homokaryotisch. Ein rezessiver Selektionsmarker fur Phycomyces blakes- 
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leanus ist z. B. dar. dar + -Stamme nehmen das toxische Riboflavin-Analog 
5-Carbon-5-deazariboflavin auf; dar~-Stamme dagegen nicht (Delbruck et 
al. 1979, Genetics 92:27). Die Selektion von rezessiven Mutanten erfolgt 
durch Zugabe von 5-Carbon-5-deazariboflavin (DARF). 

5 

Allerdings ist dieses Verfahren nicht fur Blakeslea, insbesondere Blakes- 
lea trispora bekannt und insbesondere nicht mit im Zusammenhang mit 
einer Transformation oder der Produktion von Carotinoiden Oder deren 
Vorstufen beschrieben worden. 

10 

Auch die Isolierung aus natQrlichen Quellen wird durchgefuhrt Beispiels- 
weise ist es fur die Gewinnung von Phytoen bekannt, ein Gemisch aus 
Carotinoiden, Vitamin E und anderen Komponenten, welches auch Phy- 
toen enthalt, aus Tomaten, Karotten oder Palmol usw. zu extrahieren. 
15 Problematisch ist hierbei die Trennung der einzelnen Carotinoide vonein- 
ander. So ist beispielsweise das Phytoen nach diesem Verfahren nicht in 
reiner Form erhaltlich. Insbesondere ist die natUrlich vorkommende Menge 
der Carotinoiden in den Pflanzen gering. 

20 Fermentative Verfahren sind demgegenuber technisch verhaltnismafiig 
einfach und basieren auf kostengunstigen Einsatzstoffen. Fermentative 
Verfahren zur Herstellung von. Carotinoiden konnen dann wirtschaftlich 
attraktiv und wettbewerbsfahig zur chemischen Synthese sein, wenn die 
Produktivitat der bisherigen fermentativen Verfahren gesteigert wurde oder 

25 neue Carotinoide auf Basis der bekannten Produktionsorganismen herge- 
stellt werden konnten. Problematisch bei der fermentativen Herstellung 
von Carotinoiden sind allerdings die Aufarbeitungsverfahren, die nur ge- 
ringe Mengen an hochreinen Carotinoiden bereitstellen. Zudem sind dafur 
meist aufwendige Vielschritt-Prozesse ggf. unter Verwendung grolier L6- 

30 sungsmittelmengen erforderlich. So fallen grofie Mengen Abfall an oder es 
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muss ein hoher Aufwand zur Wiederverwertung (Recycling) betrieben 
werden. 

Die Produktion von Carotinoiden durch verschiedene Mikroorganismen ist 
5 an sich bekannt. So ist z. B. in der WO 00/13654 A2 offenbart, ein Ge- 
misch aus Phytoen und Phytofluen aus Algen der Art Dunalieila sp. zu ex- 
trahieren. Auch nach diesem Verfahren ist das Phytoen nicht in reiner 
Form erhaltlich und muss von den anderen Produkten getrennt werden. 
Zudem handelt es sich urn gentechnisch unveranderte Algen, deren Bio- 
10 synthese mittels eines hinzugefugten Inhibitors beeinflusst werden muss. 

Blakeslea trispora als Produktionsorganismus fur p-Carotin ist auch aus 
der WO 98/03480 A1. bekannt. Hier werden p-Carotin Kristalle aus Bio- 
masse von Blakeslea trispora mittels Extraktion erhalten. Allerdings mus- 
ts sen in dem beschriebenen Verfahren grofie Mengen unterschiedlicher L6- 
sungsmittel eingesetzt werden, urn Kristalle mit hoher Reinheit durch meh- 
rere Extraktions- und Waschschritte zu erhalten. Auch sind die erhaltenen 
Mengen p-Carotin bezogen auf die eingesetzte Menge Biomasse klein. 

20 Aus der WO 01/83437 A1 ist ein Verfahren zur Extraktion von Astaxanthin 
aus Hefe bekannt, bei dem die Kulturbriihe zur Sterilisation und zum Zell- 
aufschluss mit Mikrowellenstrahlung behandelt wird. Der Zellaufschluss 
mittels Mikrowellenstrahlung ist danach notig, urn Astaxanthin aus Hefe zu 
gewinnen, ohne es dabei zu zerstdren. AnschlieRend soil Astaxanthin mit- 

25 tels Methanol, Ethanol Oder Aceton oder deren Mischungen extrahiert 
werden. Hierzu sind allerdings groBe Mengen Losungsmittel (5 bis 20 Tei- 
le Losungsmittel auf 1 Teil Suspension) und ein langer Zeitraum (24h) er- 
forderlich. Zudem sind keine Reinheiten des Astaxanthins angegeben und 
die erhaltenen Mengen sind klein. Versuche der Anmelderin und andere 

30 Verbffentlichungen bestatigen jedoch, dass eine Extraktion mittels Metha- 
nol oder Ethanol nicht durchfuhrbar ist. 
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Aus der WO 98/50574 ist ebenfalls die Isolierung von Carotinoid Kristalien 
aus Biomasse von Mikroorganismen bekannt, wobei hiernach im Gegen- 
satz zur WO 01/83437 A1 Methanol, Ethanol, Aceton nur zum Entfemen 

5 von Lipiden aus der Biomasse d. h. .zum Waschen verwendet werden 
kann. Als Losungsmittel zur Extraktion von Carotinoiden wird demnach 
Ethylacetat, Hexan oder ein Ol verwendet. Anschliefiend sind mehrere 
Reinigungs- und Waschschritte mit grofien Mengen Ethanol und Wasser 
notig, wobei lediglich eine Reinheit von 93,3 % bei einer Ausbeute von 35 

10 % erreicht wird. 

Die WO 03/038064 A2 beschreibt die fermentative Produktion von Lycopin 
durch Co-Kultivierung von mutiertem Blakeslea trispora Paarungstyp (-) 
und Blakeslea trispora Paarungstyp (+), die ohne Zusatz von Inhibitoren 

15 der Carotinoid Biosynthese Lycopin herstellen. Die Erzeugung der zur 
Fermentation eingesetzten Mutante wird durch unselektive chemische Mu- 
tation und anschlieliendes Screening vorgenommen. Die Aufarbeitung der 
Kulturbruhe erfolgt mittels Zellaufschluss und anschlieliender Reinigung 
mit unterschiedlichen wassrigen Medien mit verschiedenem Salzgehalt 

20 und pH-Wert und mit Wasser nicht mischbaren organischen Losungsmit- 
teln wie Ethylacetat, Hexan und 1- Butanol zur Entfernung von Lipiden. 
Alternativ ist eine Extraktion mittels groder Mengen Ethylacetat beschrie- 
ben. Angaben zur Reinheit fehlen. Da Ethylacetat und Hexan Losungsmit- 
tel fur Lycopin sind, ist davon auszugehen, dass ein Teil des Lycopins 

25 herausgewaschen und so die theoretische mogliche Ausbeute verringert 
wird. 

Auch aus der WO 01/55100 A1 ist die Isolierung von Carotinoiden allge- 
mein bzw. (3~Carotin im speziellen aus der Biomasse durch Anwendung 
30 mehrerer Wasch- und Reinigungsschritte auf die aufgeschlossene Bio- 
masse ohne Extraktion mittels L6sungsmittel beschrieben. Hierzu wird 
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aufgeschlossene Biomasse von Blakeslea trispora mit Wasser, Lauge, 
Saure, Butanol und Ethanol gewaschen, so da& eine grolle Zahl unter- 
schiedlicher Losungsmittel und wassriger Medien verwendet werden 
muss. Die Reinheit des erhaltenen p-Carotins betrSgt 96 - 98 %. Angaben 
5 zur Ausbeute fehlen jedoch. 

Die WO 97/36996 A2 beschreibt allgemein eine Verfahren zur Isolierung 
von Substanzen (u. a. Carotinoide) aus Mikroorganismen, wobei die Sub- 
stanzen aus der Biomasse mittels Fest/FIQssig-Extraktion isoliert werden. 
10 Ein Zellaufschluft soil hierbei nicht notig sein, jedoch muss die Biomasse 
zunachst durch Extrusion in eine granulierte, por5se Gestalt gebracht 
werden. Wie nur Carotinoide isoliert werden k8nnen und wie deren Rein- 
heit bzw. Ausbeute ist, ist nicht angegeben. Der Ruckstand der Extrusion 
kann anschlieliend als Futtermittelzusatz verwendet werden. 

In ailen oben beschriebenen Verfahren mussen grofte Mengen LSsungs- 
mittel zur Extraktion eingesetzt werden, urn die isolierte Menge an Caroti- 
noid durch vollstandige Extraktion zu erhohen, und/oder grolie Mengen 
w§ssriger Medien zur Reinigung und zum Waschen eingesetzt werden. 
20 Dies bedingt hohe Kosten und aufwendige Madnahmen zur Wiederver- 
wendung bzw. ggf. Abfaile. 

Zudem werden die nahrhafte Kulturbruhe und die darin enthaltene Bio- 
masse nach Extraktion bzw. Isolierung der Carotinoide als Abfall behan- 
delt. Die oben angegebenen Verfahren haben neben diesen vordergrundi- 

25 gen Nachteilen einen entscheidenden weiteren Nachteil. Es ist namlich 
danach notwendig, die Carotinoide den Nahrungsmitteln nachtraglich zu- 
zusetzen, d. h. sie sind nicht Bestandteil der Nahrungsmittel an sich bzw. 
nicht in ausreichender Menge. Von groliem Vorteil ware daher, wenn der 
Gehalt an Carotinoiden in den Nahrungsmitteln bereits durch die eigentli- 

30 chen Nahrungsmittel selbst gedeckt wiirde. 
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Es ist ebenfalls notig die Produktivitaten der bisher naturlicherweise pro- 
duzierten Carotine und deren Vorstufen weiterzu steigern und die Herstel- 
lung weiterer Carotinoide, wie z. B. Xanthophylle besonders bevorzugt 
Astaxanthin oder Zeaxanthin und Phytoen oder Bixin zu ermoglichen, die 
5 von den Wildtypen der Mikroorganismen bisher nicht oder nur in sehr ge- 
ringem Mafie gebildet und isoliert werden konnen. 

Aufgabe der Erfindung ist es gentechnisch verSnderte Zellen von Blakes- 
10 lea-Stammen, insbesondere Blakeslea trispora bereitzustellen, die Caroti- 
noide oder deren Vorstufen, insbesondere Xanthophylle, besonders be- 
vorzugt Astaxanthin oder Zeaxanthin und Phytoen oder Bixin produzieren. 
Zudem soil das Verfahren die Steigerung der Carotinoid-Produktivitat der 
veranderten Zellen gegenuber den korrespondierenden Wildtypen erlau- 
15 ben. Ferner soil das Verfahren die Erzeugung neuer Zellen oder aus ihnen 
bestehendes Mycel erlauben, die sich fur die Verwendung zur Herstellung 
von Carotinoiden oder deren Vorstufen eignen, die bisher nicht in wirt- 
schaftlich interessanten Mengen aus den naturlich vorkommenden Pilzen 
gewinnbar waren, insbesondere Xanthophylle, besonders bevorzugt Asta- 
20 xanthin oder Zeaxanthin und Phytoen oder Bixin. Das Verfahren soli dabei 
eine gentechnische Veranderung von Blakeslea-Stammen, insbesondere 
Blakeslea trispora moglich machen und die Herstellung homokaryotischer 
gentechnisch veranderter Produktions-Stamme erlauben. 

25 Des weiteren soil das Verfahren die Herstellung weiterer Carotinoide, wie 
z. B. Xanthophylle, insbesondere Astaxanthin oder Zeaxanthin und Phy- 
toen oder Bixin ermoglichen, die von den Wildtypen der Mikroorganismen 
bisher nicht oder nur in sehr geringem MafJe gebildet und isoliert werden 
konnen. 



30 
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Ferner ist es Aufgabe der vorliegenden Erfindung ein Verfahren zur Her- 
stellung von Carotinoiden aus gentechnisch veranderte Zellen von Blakes- 
lea-Stammen, insbesondere Blakeslea trispora, zur Verfugung zu stellen, 
welches den Einsatz geringerer LQsungsmittelmengen eriaubt und im we- 
5 sentlichen ohne Abfalle auskommt und zudem eine hone Reinheit und ho- 
here Ausbeuten eriaubt. 

In diesem Zusammenhang soil ein moglichst grofier Anteil der im Fermen- 
ter vorliegenden Nahrstoffe, sowohl Carotinoide als auch weitere sich in 
den Mikroorganismen befindende, verwertet werden. 

10 Somit ist es auch Aufgabe der vorliegenden Erfindung ein Verfahren zur 
Herstellung eines Carotinoid-haltigen Nahrungsmittels bereitzustellen, wo- 
bei das Nahrungsmittel selbst den Bedarf an Carotinoiden ohne Zusatze 
deckt. Insbesondere soil der Nahrstoffgehalt der nach dem Verfahren er- 
haltlichen Nahrungsmittel gegenDber den bisher erhaltlichen Nahrungsmit- 

15 teln zumindest gleichwertig sein. Ferner soli das Verfahren die effiziente 
Verwertung der produzierten Carotinoide ermoglichen. 

Diese Aufgabe wird durch ein Verfahren zur Herstellung von Carotinoiden 
20 Oder deren Vorstufen mittels gentechnisch veranderten Organismen der 
Gattung Blakeslea gelost, umfassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entstehen, in denen die Kerne in einem oder in mehreren 

25 genetischen Merkmalen alle gleichartig verandert sind und diese 

genetische Veranderung zur Auspragung bringen, und 

(iii) Selektion und Vermehrung der gentechnisch veranderten Zelle 
oder Zellen, 



Kultivierung der gentechnisch veranderten Zellen, 
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(v) Bereitstellung des von den gentechnisch veranderten Zellen 
produzierten Carotinoids oder der von den gentechnischen ver- 
anderten Zellen produzierten Carotinoidvorstufe. 

5 Mit der erfindungsgemSBen Methode ist es moglich, Blakeslea gezielt und 
stabil genetisch zu verandern, urn so Mycel aus Zellen mit einheitlichen 
Kernen zu gewinnen, das Carotinoide oder deren Vorstufen, insbesondere 
Xanthophylle, besonders bevorzugt Astaxanthin oder Zeaxanthin und Phy- 
toen oder Bixin produziert. Vorzugsweise handelt es sich um Zellen von 

10 Pilzen der Art Blakeslea trispora. Die produzierten Carotinoiden oder de- 
ren Vorstufen sind dabei im wesentlichen frei von Verunreinigungen erhalt- 
lich und es k6nnen hohe Konzentrationen der Carotinoiden oder deren 
Vorstufen im Kulturmedium erzielt werden. 

15 Unter Transformation wird die Obertragung einer genetischen Information 
in den Organismus, insbesondere Pilz verstanden. Darunter sollen alle 
dem Fachmann bekannten Moglichkeiten zur Einschleusung der Informa- 
tion, insbesondere DNA fallen, z. B. Beschuss mit DNA-beladenen Parti- 
keln, Transformation mittels Protoplasten, Mikroinjektion von DNA, Elek- 

20 troporation, Konjugation oder Transformation kompetenter Zellen, Chemi- 
kalien oder Agrobakterien vermittelte Transformation. Als genetische In- 
formation werden ein Genabschnitt, ein Gen oder mehrere Gene verstan- 
den. Die genetische Information kann z. B. mit Hilfe eines Vectors oder als 
freie Nukleinsaure (z. B. DNA, RNA) und auf sonstige Weise in die Zellen 

25 eingebracht und entweder durch Rekombination ins Wirtsgenom einge- 
baut oder in freier Form in der Zelle vorliegen. Besonders bevorzugt ist 
hierbei die homologe Rekombination. 

Bevorzugte Transformationsmethode ist die Agrobacterium tumefaciens- 
30 vermittelte Transformation. Hierzu wird zunachst die zu transferierende 
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Spender-DNA in einen Vektor eingefugt, der (i) flankierend zu der zu 
transferierenden DNA die T-DNA-Enden tragt, der (ii) einen Selektions- 
marker enthalt und der (iii) ggf . Promotoren und Terminatoren fiir die Ge- 
nexpression der Spender-DNA aufweist. Dieser Vektor wird in einen Agro- 

5 bacterium-tumefaciens-Stamm Qbertragen, der ein Ti-Plasmid mit den vir- 
Genen enthalt. vir-Gene sind fiir den DNA-Transfer in Blakeslea verant- 
wortlich. Mit diesem Zwei-Vektor-System wird die DNA von Agrobacterium 
in Blakeslea Qbertragen. Hierzu werden die Agrobakterien zunachst in 
Gegenwart von Acetosyringone inkubiert. Acetosyringone induziert die vir- 

10 Gene. Anschlie&end werden Sporen von Blakeslea trispora zusammen mit 
den induzierten Zellen von Agrobacterium tumefaciens auf Acetosyringo- 
ne-haltigem Medium inkubiert und dann auf Medium Qbertragen, das eine 
Selektion der Transformanten, d.h. der gentechnisch verSnderten Stamme 
von Blakeslea ermoglicht. 

15 

Der Begriff Vector wird in der vorliegenden Anmeldung als eine Bezeich- 
nung fur ein DNA-MolekQI verwendet, das zum Einschleusen und ggf. zur 
Vermehrung von Fremd-DNA in eine Zelle dient (siehe auch "Vector" in 
Rompp Lexikon Chemie - CDROM Version 2.0, Stuttgart/New York: Ge- 
20 org Thieme Verlag 1999). In der vorliegenden Anmeldung sollen unter 
dem begriff "Vector" auch Plasmide, Cosmide usw. verstanden werden, 
die dem gleichen Zweck dienen. 

Unter Expression wird in der vorliegenden Anmeldung die Qbertragung 
25 einer genetischen Information ausgehend von DNA Oder RNA in ein Gen- 
Produkt (hier vorzugsweise Enzyme zur Herstellung von Carotinoiden und 
insbesondere Xanthophylle, besonders bevorzugt Astaxanthin oder Zea- 
xanthin und Phytoen oder Bixin) verstanden und soil auch den Begriff der 
Oberexpression beinhalten, womit eine verstarkte Expression gemeint ist, 
30 so dass ein bereits in der nicht transformierten Zelle (Wildtyp) hergestell- 
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tes Genprodukt verstarkt produziert wird oder einen grolien Teil des ge- 
samten Gehaltes der Zelle ausmacht. 

Unter gentechnische Veranderung soli die Einschleusung genetischer In- 
5 formation in einen Empfangerorganismus, so dass diese stabil exprimiert 
und bei der Zellteilung weitergegeben wird, verstanden werden. In diesem 
Zusammenhang ist die Homokaryotisierung, die Herstellung von Zellen, 
die nur einheitliche Kerne enthalten, d. h. Kerne mit gleichem genetischem 
Informationsgehalt. 

10 

Diese Homokaryotisierung ist nur notwendig, wenn die durch Transforma- 
tion eingefuhrte genetische Information rezessiv vorliegt, d. h. nicht zur 
Auspragung gelangt. Fuhrt die Transformation aber zu einem dominanten 
Vorliegen der genetischen Information, d. h. wird sie ausgepragt, so ist 
15 eine Homokaryotisierung nicht unbedingt notig. 

Vorzugsweise wird zur Homokaryotisierung eine Selektion der einkernigen 
Sporen durchgefuhrt. Von Natur aus ist ein geringer Anteil der Sporen von 
Blakeslea trispora einkernig, so dass sich diese ggf. nach spezifischer 
20 Markierung z. B. Farbung der Zellkerne aussortieren lassen. Dies wird be- 
vorzugterweise mittels FACS (Fluorescence Activated Cell Sorting) an- 
hand der geringeren Fluoreszenz der einkernigen Zellen durchgefuhrt. 

Alternativ kann zur Homokaryotisierung zunfichst eine Kernreduktion 
25 durchgefuhrt werden. Hierzu kann ein mutagenes Agens eingesetzt wer- 
den, wobei es sich insbesondere urn N-Methyl-N-nitro-nitrosoguanidin 
(MNNG) handelt. Auch die Verwendung von energiereichen Strahlen, wie 
UV- oder Rontgen-Strahlen zur Kernreduktion ist moglich. Anschliefiend 
kann zur Selektion auf das FACS Verfahren oder rezessive Selektions- 
30 marker zuruckgegriffen werden. 
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Unter Selektion wird die Auswahl von Zellen verstanden, deren Kerne die- 
selbe genetische Information beinhalten, d. h. Zellen die die gleichen Ei- 
genschaften aufweisen, wie Resistenzen oder die Herstellung bzw. ver- 
mehrte Herstellung eines Produktes. In der Selektion werden neben der 
5 FACS Methode bevorzugt 5-Carbon-5-deazariboflavin (DARF) und Hy- 
gromycin (hyg) oder 5-Fluororotat (FOA) und Uracil eingesetzt. 

Der in der Transformation (i) eingesetzte Vector kann derart gestaltet sein, 
dass die im Vector enthaltene genetische Information in das Genom min- 

10 destens einer Zelle integriert wird. Dabei kann genetische Information in 
derZelle ausgeschaltet werden. Dies kann direkt, d. h. durch eine Deletion 
erfolgen. Es ist aber auch moglich, dali der in der Transformation (i) ein- 
gesetzte Vector derart ausgestaltet ist, dass die im Vector enthaltene ge- 
netische Information in der Zelle exprimiert wird, d. h. genetische Informa- 

15 tion eingefiigt wird, die im korrespondierenden Wildtyp nicht vorhanden ist 
oder die durch die Transformation verstarkt bzw. uberexprimiert wird und 
deren Produkt das Gen ausschaltet. Die eingefiihrte genetische Informati- 
on kann aber auch indirekt eine genetische Information in der Zelle aus- 
schalten, z. B. durch Produktion eines Inhibitors. 

20 

Der eingesetzte Vector enthalt genetische Informationen oder Teile der 
genetischen Information zur Herstellung von Carotinoiden oder deren Vor- 
stufen, insbesondere Carotinen oder Xanthophyllen oder deren Vorstufen. 
Der eingesetzte Vector enthalt vorzugsweise genetische Informationen zur 
25 Herstellung von Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, p- 
Carotin, Andonixanthin, Adonirubin, Canthaxanthin, 3-Hydroxyechinenon, 
3-Hydroxyechinenon, Lycopiri, Lutein, Bixin oder Phytoen. Ganz beson- 
ders bevorzugt enthalt der Vector Informationen zur Herstellung von Bixin, 
Phytoen, Canthaxanthin, Astaxanthin oder Zeaxanthin. 
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Der Vector kann beliebige genetische Informationen zur genetischen Ver- 
anderungen von Organismen der Gattung Blakeslea enthalten. 

Unter „genetischer Information" werden vorzugsweise Nukleinsauren ver- 
5 standen, deren Einbringung in den Organismus der Gattung Blakeslea zu 
einer genetischen Veranderung in Organismen der Gattung Blakeslea, 
also beispielsweise zu einer Verursachung, Erhohung Oder Reduzierung 
von Enzymaktivitaten im Vergleich zum Ausgangsorganismus fuhren. 

10 Der Vector kann beispielsweise genetische Information zur Herstellung 
lipophiler Substanzen enthalten wie z.B. Carotinoide und deren Vorstufen, 
Phospholipids, Triacylglyceride, Steroide, Wachse, fettlosliche Vitamine, 
Provitamine und Cofaktoren oder genetische Information zur Herstellung 
hydrophiler Substanzen wie z.B. Eiweilie, Aminosauren, Nukleotide und 

15 wasserlosliche Vitaminen, Provitamine und Cofaktoren. 

Bevorzugterweise enthalt der eingesetzte Vector genetische Informationen 
zur Herstellung von Carotinoiden oder Xanthophyllen oder deren Vorstu- 
fen. 

20 

Bevorzugterweise enthalt der Vektor genetische Information, die eine Lo- 
kalisierung der Carotinoidbiosynthese-Enzyme in dem Zellkompartiment 
bewirkt, in dem die Carotinoidbiosynthese stattfindet. 

25 Besonders bevorzugt sind genetische Informationen zur Herstellung von 
Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, 
Adonirubin, Canthaxanthin, 3- und 3'-Hydroxyechinenon, Lycopin, Lutein, 
p-Carotin, Phytoen und/oder Phytofluen. Ganz besonders bevorzugt sind 
genetische Informationen zur Herstellung von Phytoen, Bixin, Lycopin, 

30 Zeaxanthin, Canthaxanthin und/oder Astaxanthin. 
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Entsprechend werden in einer bevorzugten Variante der Erfindung Orga- 
nismen hergestellt und kultiviert, die uber eine erhohte Syntheserate fur 
Zwischenprodukte der Carotinoidbiosynthese verfugen und folglich eine 
erhohte Produktivitat fur Endprodukte der Carotinoidbiosynthese aufwei- 
5 sen. Zur Erhohung der Syntheserate fur Zwischenprodukte der Caroti- 
noidbiosynthese werden insbesondere die Aktivitaten der Enzyme 3- 
Hydroxy-3-Methyl-Glutaryl-Coenzym-A-Reduktase (HMG-CoA- 
Reduktase), Isopentenylpyrophosphat-lsomerase und Geranylpy- 
rophosphatsynthase gesteigert. 

10 

Entsprechend werden in einer besonders bevorzugten Variante der Erfin- 
dung Organismen hergestellt und kultiviert, die gegenuber dem Wildtyp 
eine erhShte HMG-CoA-Reduktase-Aktivitat aufweisen. 

15 Unter HMG-CoA-Reduktase-Aktivitat wird die Enzymaktivitat einer HMG- 
CoA-Reduktase (3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A-Reduktase) 
verstanden. 

Unter einer HMG-CoA-Reduktase wird ein Protein verstanden, das 
die enzymatische Aktivitat aufweist 3-Hydroxy-3-Methyl-Glutaryl- 
20 Coenzym-A in Mevalonat umzuwandeln. 

Dementsprechend wird unter HMG-CoA-Reduktase-Aktivitat die in einer 
bestimmten Zeit durch das Protein HMG-CoA-Reduktase umgesetzte 
Menge 3-Hydroxy-3-Methyl-Glutaryl-Coenzym-A bzw. gebildete Menge 
25 Mevalonat verstanden. 

Bei einer erhohten HMG-CoA-Reduktase-Aktivitat gegenGber dem Wildtyp 
wird somit im Vergleich zum Wildtyp in einer bestimmten Zeit durch das 
Protein HMG-CoA-Reduktase die umgesetzte Menge 3-Hydroxy-3-Methyl- 
30 Glutaryl-Coenzym-A bzw. die gebildete Menge Mevalonat erhSht. 
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Vorzugsweise betragt diese ErhShung der HMG-CoA-Reduktase-Aktivitat 
mindestens 5%, weiter bevorzugt mindestens 20%, weiter bevorzugt min- 
destens 50%, weiter bevorzugt mindestens 100%, besonders bevorzugt 
mindestens 300%, noch bevorzugter mindestens 500%, insbesondere 
5 mindestens 600% der HMG-CoA-Reduktase-Aktivitat des Wildtyps. 

In einer bevorzugten Ausfuhrungsform erfolgt die Erhohung der HMG- 
CoA-Reduktase-Aktivitat gegenuber dem Wildtyp durch eine Erhohung der 
Genexpression einer Nukleinsaure codierend eine HMG-CoA-Reduktase. 

10 

In einer besonders bevorzugten Ausfuhrungsform des erfindungsgemaden 
Verfahrens erfolgt die Erhohung der Genexpression einer Nukleinsaure 
codierend eine HMG-CoA-Reduktase indem man ein Nukleinsaurekon- 
strukt, enthaltend eine Nukleinsaure codierend eine HMG-CoA-Reduktase 
15 in den Organismus einbringt, deren Expression in dem Organismus, ver- 
glichen mit dem Wildtyp, einer reduzierten Regulation unterliegt. 

Unter einer reduzierten Regulation verglichen mit dem Wildtyp, wird eine 
im Vergleich zum vorstehend definierten Wildtyp verringerte, vorzugsweise 
20 keine Regulation auf Expressions- oder Proteinebene verstanden. 

Die reduzierte Regulation kann vorzugsweise durch einen im Nukleinsau- 
rekonstrukt mit der kodierenden Sequenz funktionell verknupften Promotor 
erreicht werden, der in dem Organismus verglichen mit dem Wildtyp- 
25 Promoter einer reduzierten Regulation unterliegt. 

Beispielsweise unterliegen die Promotoren ptefl aus Blakeslea trispora 
und pgpdA aus Aspergillus nidulans nur einer reduzierten Regulation und 
sind daher insbesondere als Promotoren bevorzugt. 



30 
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Diese Promotoren zeigen eine annahernd konstitutive Expression in Bla- 
keslea trispora, so dass die transkriptionelle Regulation nicht mehr uber 
die Intermediate der Carotinoidbiosynthese ablSuft. 

5 Die reduzierte Regulation kann in einer weiteren bevorzugten Ausfuh- 
rungsform dadurch erreicht werden, dass man als Nukleinsaure codierend 
eine HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren Expressi- 
on in dem Organismus, verglichen mit der Organismus eigenen, ortholo- 
gen Nukleinsaure, einer reduzierten Regulation unterliegt. 

10 

Besonders bevorzugt ist die Verwendung einer Nukleinsaure, die nur den 
katalytischen Bereich der HMG-CoA-Reduktase kodiert (trunkierte (t- 
)HMG-CoA-Reduktase). Die fiir die Regulation verantwortliche Membran- 
Domane fehlt. Die verwendete Nukleinsaure unterliegt somit einer redu- 
15 zierten Regulation und fuhrt zu einer Erhahung der Genexpression der 
HMG-CoA-Reduktase. 

In einer besonders bevorzugten Ausfiihrungsform bringt man Nukleinsau- 
ren in Blakeslea trispora ein, welche die Sequenz SEQ ID. NO. 75 enthal- 
20 ten. 

Weitere Beispiele fur HMG-CoA-Reduktasen und damit auch fiir die auf 
den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich beispielsweise aus verschiedenen Orga- 
25 nismen, deren genomische Sequenz bekannt ist, durch Homologieverglei- 
che der Sequenzen aus Datenbanken mit der SEQ ID. NO. 75 leicht auf- 
finden. 

Weitere Beispiele fiir HMG-CoA-Reduktasen und damit auch fOr die auf 
30 den katalytischen Bereich reduzierten t-HMG-CoA-Reduktasen bzw. die 
kodierenden Gene lassen sich weiterhin beispielsweise ausgehend von 
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der Sequenz SEQ ID. NO. 75 aus verschiedenen Organismen deren ge- 
nomische Sequenz nicht bekannt ist, durch Hybridisierungs- und PCR- 
Techniken in an sich bekannter Weise leicht auffinden. 

5 In einer besonders bevorzugten AusfQhrungsform wird die reduzierte Re- 
gulation dadurch erreicht, dass man als Nukleinsaure codierend eine 
HMG-CoA-Reduktase eine Nukleinsaure verwendet, deren Expression in 
dem Organismus, verglichen mit der Organismus eigenen, orthologen Nu- 
kleinsaure, einer reduzierten Regulation unterliegt und einen Promotor 

w verwendet, der in dem Organismus, verglichen mit dem Wildtyp-Promoter 
einer reduzierten Regulation unterliegt. 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch die 
Transformation die Genexpression der Phytoendesaturase ausgeschaltet, 
15 so dass das von den Organismen produzierte Phytoen gewonnen werden 
kann. Der in der Transformation (i) eingesetzte Vector umfasst daher in 
einer AusfQhrungsform der Erfindung bevorzugterweise eine Sequenz co- 
dierend fur ein Fragment des Gens der Phytoendesaturase, insbesondere 
carB aus Blakeslea trispora mit der SEQ ID NO: 69. 

20 

Entsprechend wird in einer bevorzugten Variante der Erfindung durch 
Transformation die Genexpression der Lycopincyclase ausgeschaltet, so 
dass das von den Organismen produzierte Lycopin gewonnen werden 
kann. Der in der Transformation eingesetzte Vektor umfasst daher in einer 
25 AusfQhrungsform der Erfindung bevorzugterweise eine Sequenz codie- 
rend fur ein Fragment des Gens der Lycopincyclase, insbesondere carR 
aus Blakeslea trispora. 

30 In einer bevorzugten AusfQhrungsform werden die Organismen der Gat- 
tung Blakeslea beispielsweise dadurch in die Lage versetzt Xanthophylle, 
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wie beispielsweise Canthaxanthin, Zeaxanthin oder Astaxanthin herzustei- 
len, Bixin oder Phytoen, indem in den genetisch veranderten Organismen 
der Gattung Blakeslea im Vergleich zum Wildtyp eine Hydroxylase- 
Aktivitat und/oder Ketolase-Aktivitat verursacht wird. 

5 

Der in der Transformation (i) eingesetzte Vector enthalt also in einer weite- 
ren, bevorzugten Variante der Erfindung genetische Informationen, die 
nach Expression eine Ketolase- und/oder Hydroxylase-Aktivitat entfalten, 
so dass die Organismen Zeaxanthin oder Astaxanthin produzieren. 

10 

Unter Ketolase-Aktivitat wird die Enzymaktivitat einer Ketolase verstan- 
den. 

Unter einer Ketolase wird ein Protein verstanden, das die enzymatische 
15 Aktivitat aufweist, am, gegebenenfalls substituierten, p-lonon-Ring von 
Carotinoiden eine Keto-Gruppe einzufuhren. 

Insbesondere wird unter einer Ketolase ein Protein verstanden, das die 
enzymatische Aktivitat aufweist, p-Carotin in Canthaxanthin umzuwandeln. 

20 

Dementsprechend wird unter Ketolase-Aktivitat die in einer bestimmten 
Zeit durch das Protein Ketolase umgesetzte Menge (3-Carotin bzw. gebil- 
dete Menge Canthaxanthin verstanden. 

25 Unter dem Begriff "Wildtyp" wird erfindungsgemaft der entsprechende 
nicht genetisch veranderte Ausgangsorganismus der Gattung Blakesleaa 
verstanden. 



Je nach Zusammenhang kann unter dem Begriff "Organismus" der Aus- 
30 gangsorganismus (Wildtyp) der Gattung Blakesleaa oder ein erfindungs- 
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gemafier, genetisch veranderter Organismus der Gattung Blakesleaa oder 
beides verstanden werden. 

Vorzugsweise wird unter "Wildtyp" fur die Verursachung der Ketolase- 
5 Aktivitat und fur die Verursachung der Hydroxylase-Aktivitat jeweils eine 
Referenz Organismus verstanden. 

Dieser Referenzorganismus der Gattung Blakeslea ist Blakeslea trispora 
ATCC 14271 oder ATCC 14272, die sich lediglich im Paarungstyp unter- 
10 scheiden. 

Die Bestimmung der Ketolase-Aktivitat in erfindungsgemaBen genetisch 
veranderten Organismen der Gattung Blakesleaa und in Wildtyp- bzw. Re- 
ferenzorganismen erfolgt vorzugsweise unter folgenden Bedingungen: 

15 

Die Bestimmung der Ketolase-Aktivitat in Organismen der Gattung Blakes- 
lea erfolgt in Anlehnung an die Methode von Frazer et aL, (J. Biol. Chem. 
272(10): 6128-6135, 1997). Die Ketolase-Aktivitat in Extrakten wird mit 
den Substraten beta-Carotin und Canthaxanthin in Gegenwart von Lipid 
20 (Sojalecithin) und Detergens (Natriumcholat) bestimmt. Substrat/Produkt- 
Verhaltnisse aus den Ketolase-Assays werden mittels HPLC ermittelt. 

Der erfindungsgemaBe genetisch veranderte Organismus der Gattung 
Blakesleaa weist in dieser, bevorzugten Ausfuhrungsform im Vergleich 
25 zum genetisch nicht veranderten Wildtyp eine Ketolase-Aktivitat auf und ist 
somit vorzugsweise in der Lage, transgen eine Ketolase zu exprimieren. 

In einer.weiter bevorzugten Ausfuhrungsform erfolgt die Verursachung der 
Ketolase-Aktivitat in den Organismen der Gattung Blakesleaa durch Ver- 
30 ursachung der Genexpression einer Nukleinsaure kodierend eine Ketola- 
se. 
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In dieser bevorzugten Ausftihrungsform erfoigt die Verursachung der Ge- 
nexpression einer Nukleinsaure kodierend eine Ketolase vorzugsweise 
durch Einbringen von Nukleinsauren, die Ketolasen kodieren in die Aus- 
5 gangsorganismus der Gattung Blakesleaa. 

Dazu kann prinzipiell jedes Ketolase-Gen, also jede Nukleinsauren die 
eine Ketolase codiert verwendet werden. 

10 Alle in der Beschreibung erwahnten Nukleinsauren k5nnen beispielsweise 
eine RNA-, DNA- oder cDNA-Sequenz sein. 

Bei genomischen Ketolase-Sequenzen aus eukaryontischen Quellen, die 
Introns enthalten, sind fur den Fall das der Wirtsorganismus der Gattung 
15 Blakesleaa nicht in der Lage ist oder nicht in die Lage versetzt werden 
kann, die entsprechenden Ketolase zu exprimieren, bevorzugt bereits pro- 
zessierte Nukleinsauresequenzen, wie die entsprechenden cDNAs zu 
verwenden. 

20 Beispiele fur Nukleinsauren, kodierend eine Ketolase und die entspre- 
chenden Ketolasen, die im erfindungsgemafien Verfahren verwendet wer- 
den konnen sind beispielsweise Sequenzen aus: 

Haematoccus pluvialis, insbesondere aus Haematoccus pluvialis Flotow 
25 em. Wille (Accession NO: X86782; Nukleinsaure: SEQ ID NO: 1 1 , Protein 
SEQ ID NO: 12), 

Haematoccus pluvialis, NIES-144 (Accession NO: D45881; Nukleinsaure: 
SEQ ID NO: 13, Protein SEQ ID NO: 14), 

30 
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Agrobacterium aurantiacum (Accession NO: D58420; Nukleinsaure: SEQ 
ID NO: 15, Protein SEQ ID NO: 16), 

Alicaligenes spec. (Accession NO: D58422; Nukleinsaure: SEQ ID NO: 17, 
5 Protein SEQ ID NO: 18), 

Paracoccus marcusii (Accession NO: Y15112; Nukleinsaure: SEQ ID NO: 
19, Protein SEQ ID NO: 20). 

10 Synechocystis sp. Strain PC6803 (Accession NO: NP442491 ; Nukleinsau- 
re: SEQ ID NO: 21, Protein SEQ ID NO: 22). 

Bradyrhizobium sp. (Accession NO: AF218415; Nukleinsaure: SEQ ID NO: 
23, Protein SEQ ID NO: 24). 

15 

Nostoc sp. Strain PCC7120 (Accession NO: AP003592, BAB74888; Nu- 
kleinsaure: SEQ ID NO: 25, Protein SEQ ID NO: 26), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
20 NZ_AABC01000195, Basenpaar 55,604 bis 55,392 (SEQ ID NO: 27); Pro- 
tein: Acc.-No. ZP_001 1 1258 (SEQ ID NO: 28) (als putatives Protein an- 
notiert), 

Nostoc punctiforme ATTC 29133, Nukleinsaure: Acc.-No. 
25 NZ_AABC01000196, Basenpaar 140,571 bis 139,810 (SEQ ID NO: 29), 
Protein: (SEQ ID NO: 30) (nicht annotiert), 

Weitere naturliche Beispiele fur Ketolasen und Ketolase-Gene, die im er- 
findungsgemalien Verfahren verwendet werden kdnnen, lassen sich bei- 
30 spielsweise aus verschiedenen Organismen, deren genomische Sequenz 
bekannt ist, durch Identitatsvergleiche der Aminosauresequenzen oder der 
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entsprechenden ruckiibersetzten Nukleinsauresequenzen aus Datenban- 
ken mit den vorstehend beschriebenen Sequenzen und insbesondere mit 
den Sequenzen SEQ ID NO: 12, 26 und/oder 33 leicht auffinden. 

5 Weitere natiiriiche Beispiele fur Ketolasen und Ketolase-Gene lassen sich 
weiterhin ausgehend von den vorstehend beschriebenen Nukleinsaurese- 
quenzen, insbesondere ausgehend von den Sequenzen SEQ ID NO: 12, 
26 und/oder 30 aus verschiedenen Organismen, deren genomische Se- 
quenz nicht bekannt ist, durch Hybridisierungstechniken in an sich be- 

10 kannter Weise leicht auffinden. 

Die Hybridisierung kann unter moderaten (geringe Stringenz) oder vor- 
zugsweise unter stringenten (hohe Stringenz) Bedingungen erfolgen. 

15 Solche Hybridisierungsbedingungen sind beispieisweise bei Sambrook, J., 
Fritsch, E.F., Maniatis, T., in: Molecular Cloning (A Laboratory Manual), 2. 
Auflage, Cold Spring Harbor Laboratory Press, 1989, Seiten 9.31-9.57 
oder in Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. 
(1989), 6.3.1-6.3.6 beschrieben. 

20 

Beispielhaft konnen die Bedingungen wahrend des Waschschrittes aus- 
gewahlt sein aus dem Bereich von Bedingungen begrenzt von solchen mit 
geringer Stringenz (mit 2X SSC bei 50_C) und solchen mit hoher Strin- 
genz (mit 0.2X SSC bei 50_C, bevorzugt bei 65_C) (20X SSC: 0,3 M Na- 
25 triumcitrat, 3 M Natriumchlorid, pH 7.0). 

Daruberhinaus kann die Temperatur wahrend des Waschschrittes von 
moderaten Bedingungen bei Raumtemperatur, 22°C, bis zu stringenten 
Bedingungen bei 65°C angehoben werden. 
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10 



Beide Parameter, Salzkonzentration und Temperatur, konnen gleichzeitig 
variiert werden, auch kann einer der beiden Parameter konstant gehalten 
und nur der andere variiert werden. Wahrend der Hybridisierung kdnnen 
auch denaturierende Agenzien wie zum Beispiel Formamid oder SDS ein- 
gesetzt werden. In Gegenwart von 50% Formamid wird die Hybridisierung 
bevorzugt bei 42°C ausgefiihrt. 

Einige beispielhafte Bedingungen fur Hybridisierung und Waschschritt sind 
infolge gegeben: 



(1) Hybridiserungsbedingungen mit zum Beispiel 
"(i) 4X SSC bei 65°C, oder 

(ii) 6X SSC bei 45°C, oder 

(iii) 6X SSC bei 68°C, 100 mg/ml denaturierter Fischsperma-DNA, oder 
15 (iv) 6X SSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachs- 

sperma-DNA bei 68°C, oder 

(v) 6XSSC, 0.5 % SDS, 100 mg/ml denaturierte, fragmentierte Lachs- 
sperma-DNA, 50 % Formamid bei 42°C, oder 

(vi) 50 % Formamid, 4X SSC bei 42°C, oder 

20 (vii) 50 % (vol/vol) Formamid, 0.1 % Rinderserumalbumin, 0.1 % Ficoll, 
0.1 % Polyvinylpyrrolidon, 50 mM Natriumphosphatpuffer pH 6.5, 750 mM 
NaCI, 75 mM Natriumcitrat bei 42°C, oder 

(viii) 2X oder 4X SSC bei 50°C (moderate Bedingungen), oder 

(ix) 30 bis 40 % Formamid, 2X oder 4X SSC bei 42°C (moderate Be- 
25 dingungen). 

(2) Waschschritte fur jeweils 10 Minuten mit zum Beispiel 

(i) 0.015 M NaCI/0.0015 M Natriumcitrat/0.1 % SDS bei 50°C, oder 

(ii) 0.1X SSC bei 65°C, oder 

30 (iii) 0.1X SSC, 0.5 % SDS bei 68°C, oder 

(iv) 0.1X SSC, 0.5 % SDS, 50 % Formamid bei 42°C, oder 
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(v) 0.2X SSC, 0.1 % SDS bei 42°C, oder 

(vl) 2X SSC bei 65°C (moderate Bedingungen). 

In einer bevorzugten Ausfiihrungsform der erfindungsgemalien genetisch 
5 veranderten Organismen der Gattung Blakeslea bringt man Nukleinsauren 
ein, die ein Protein kodieren, enthaltend die Aminosauresequenz SEQ ID 
NO: 12 oder eine von dieser Sequenz durch Substitution, Insertion oder 
Deletion von Aminosauren abgeleitete Sequenz, die eine Identitat von 
mindestens 20 %, vorzugsweise mindestens 30%, 40%, 50%, 60%, be- 
10 vorzugt mindestens 70%, 80%, besonders bevorzugt mindestens 90%, 
insbesondere 91%, 92%; 93%, 94%, 95%, 96%, 97%, 98% oder 99% auf 
Aminosaureebene mit der Sequenz SEQ ID NO: 12 und die enzymatische 
Eigenschaft einer Ketolase aufweist. 

15 Dabei kann es sich urn eine naturliche Ketolase-Sequenz handeln, die wie 
vorstehend beschrieben durch Identitatsvergleich der Sequenzen aus an- 
deren Organismen gefunden werden kann oder urn eine kunstliche Keto- 
lase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 12 durch 
kunstliche Variation, beispielsweise durch Substitution, Insertion oder De- 

20 letion von Aminosauren abgewandelt wurde. 

In einer weiteren, bevorzugten AusfOhrungsform der erfindungsgemafcen 
Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, enthal- 
tend die Aminosauresequenz SEQ ID NO: 26 oder eine von dieser Se- 

25 quenz durch Substitution, Insertion oder Deletion von Aminosauren abge- 
leitete Sequenz, die eine Identitat von mindestens 20 %, vorzugsweise 
mindestens 30%, 40%, 50%, 60%, bevorzugt mindestens 70%, 80%, be- 
sonders bevorzugt mindestens 90%, insbesondere 91%, 92%; 93%, 94%, 
95%, 96%, 97%, 98% oder 99% auf Aminosaureebene mit der Sequenz 

30 SEQ ID NO: 26 und die enzymatische Eigenschaft einer Ketolase auf- 
weist. 
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Dabei kann es sich urn eine naturiiche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder urn eine kunstiiche Ke- 
5 tolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 26 durch 
kunstiiche Variation, beispielsweise durch Substitution, Insertion oder De- 
letion von Aminosauren abgewandelt wurde. 

In einer weiteren, bevorzugten Ausfuhrungsform der erfindungsgemalien 
10 Verfahren bringt man Nukleinsauren ein die ein Protein kodieren, enthal- 
tend die AminosSuresequenz SEQ ID NO: 30 oder eine von dieser Se- 
quenz durch Substitution, Insertion oder Deletion von Aminosauren abge- 
leitete Sequenz, die eine Identitat von mindestens 20 %, vorzugsweise 
mindestens 30 %, 40 %, 50 %, bevorzugt mindestens 60 %, 70 %, bevor- 
15 zugter mindestens 80 %, 85 % besonders bevorzugt mindestens 90 %, 
insbesondere 91 %, 92 %, 93 %, 94 %, 95^%, 96 %, 97 %, 98 %, 99 % auf 
Aminosaureebene mit der Sequenz SEQ ID NO 30 und die enzymatische 
Eigenschaft einer Ketolase aufweist. 

20 Dabei kann es sich urn eine naturiiche Ketolase-Sequenz handeln, die, 
wie vorstehend beschrieben, durch Identitatsvergleich der Sequenzen aus 
anderen Organismen gefunden werden kann oder urn eine kunstiiche Ke- 
tolase-Sequenz die ausgehend von der Sequenz SEQ ID NO: 30 durch 
kunstiiche Variation, beispielsweise durch Substitution, Insertion oder De- 

25 letion von Aminosauren abgewandelt wurde. 

Unter dem Begriff "Substitution" ist in der Beschreibung der Austausch 
einer oder mehrerer Aminosauren durch eine oder mehrere Aminosauren 
zu verstehen. Bevorzugt werden sog. konservative Austausche durchge- 
30 fuhrt, bei denen die ersetzte Aminosaure eine ahnliche Eigenschaft hat 
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wie die urspriingliche Aminosaure, beispielsweise Austausch von Glu 
durch Asp, Gin durch Asn, Val durch He, Leu durch lie, Ser durch Thr. 

Deletion ist das Ersetzen einer Aminosaure durch eine direkte Bindung. 
5 Bevorzugte Positionen fQr Deletionen sind die Termini des Polypeptides 
und die Verknupfungen zwischen den einzelnen Proteindomanen. 

Insertionen sind Einfugungen von Aminosauren in die Polypeptidkette, 
wobei formal eine direkte Bindung durch ein oder mehrere Aminosauren 
10 ersetzt wird - 

Unter Identitat zwischen zwei Proteinen wird die Identitat der Aminosauren 
uber die jeweils gesamte Proteinlange verstanden, insbesondere die Iden- 
titat die durch Vergleich mit Hilfe der Lasergene Software der Firma 
15 DNASTAR, inc. Madison, Wisconsin (USA) unter Anwendung der Clustal 
Methode (Higgins DG, Sharp PM. Fast and sensitive multiple sequence 
alignments on a microcomputer. Comput Appl. Biosci. 1989 Apr;5(2):151- 
1) unter Einstellung folgender Parameter berechnet wird: 

20 Multiple alignment parameter: 

Gap penalty 10 

Gap length penalty 10' 

Pairwise alignment parameter: 

K-tuple 1 
25 Gap penalty 3 

Window 5 

Diagonals saved 5 

Unter einem Protein, das eine Identitat von mindestens 20% auf Amino- 
30 saureebene mit der Sequenz SEQ ID NO: 12 oder 26 oder 30 aufweist, 
wird dementsprechend ein Protein verstanden, das bei einem Vergleich 
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seiner Sequenz mit der Sequenz SEQ ID NO: 12 Oder 26 Oder 30, insbe- 
sondere nach obigen Programmlogarithmus mit obigem Parametersatz 
eine Identitat von mindestens 20 %, bevorzugt 30%, 40%, 50%, beson- 
ders bevorzugt 60%, 70%, 80%, insbesondere 85%, 90, 95% aufweist. 

5 

Geeignete Nukleinsauresequenzen sind beispielsweise durch RQckuber- 
setzung der Polypeptidsequenz gemali dem genetischen Code erhaltlich. 

Bevorzugt werden dafur solche Codons verwendet, die entsprechend der 
10 Blakesleaaspezifischen codon usage haufig verwendet werden. Die codon 
usage lasst sich anhand von Computerauswertungen anderer, bekannter 
Gene von Organismen der Gattung Blakesleaa leicht ermitteln. 

In einer besonders bevorzugten Ausfuhrungsform bringt man eine Nu- 
15 kleinsaure, enthaltehd die Sequenz SEQ ID NO: 1 1 in die Organismus der 
Gattung ein. 

In einer weiteren, besonders bevorzugten Ausfuhrungsform bringt man 
eine Nukleinsaure, enthaitend die Sequenz SEQ ID NO: 25 in die Orga- 
20 nismus der Gattung ein. 

In einer weiteren, besonders bevorzugten Ausfuhrungsform bringt man 
eine Nukleinsaure, enthaitend die Sequenz SEQ ID NO: 29 in die Orga- 
nismus der Gattung ein. 

25 

Alle vorstehend erwahnten Ketolase-Gene sind weiterhin in an sich be- 
kannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
wie beispielsweise durch Fragmentkondensation einzelner uberlappender, 
komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 
30 chemische Synthese von Oligonukleotiden kann beispielsweise, in be- 
kannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 2. Auflage, 
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Wiley Press New York, S. 896-897) erfolgen. Die Anlagerung syntheti- 
scher.Oligonukleotide und Auffullen von Lucken mithilfe des Klenow- 
Fragmentes der DNA-Polymerase und Ligationsreaktionen sowie allge- 
meine Klonierungsverfahren werden in Sambrook et al. (1989), Molecular 
5 cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, 
beschrieben. 

Der in der Transformation (i) eingesetzte Vector umfasst daher in einer 
Ausfuhrungsform der Erfindung bevorzugterweise eine Sequenz codie- 
10 rend fur eine Ketolase, insbesondere der Ketolase Nostoc punctiforme aus 
mit der SEQ ID NO: 72. 

Unter Hydroxylase-Aktivitat die Enzymaktivitat einer Hydroxylase verstan- 
den. 

15 

Unter einer Hydroxylase wird ein Protein verstanden, das die enzymati- 
sche Aktivitat aufweist, am, gegebenenfalls substituierten, B-lonon-Ring 
von Carotinoiden eine Hydroxy-Gruppe einzufuhren. 

20 Insbesondere wird unter einer Hydroxylase ein Protein verstanden, das 
die enzymatische Aktivitat aufweist, B-Carotin in Zeaxanthin oder Canta- 
xanthin in Astaxanthin umzuwandeln. 

Dementsprechend wird unter Hydroxyase-Aktivitat die in einer bestimmten 
25 Zeit durch das Protein Hydroxylase umgesetzte Menge B-Carotin oder 
Cantaxanthin bzw. gebildete Menge Zeaxanthin oder Astaxanthin verstan- 
den. 

Bei einer erhohten Hydroxylase-Aktivitat gegeniiber dem Wildtyp wird 
30 somit im Vergleich zum Wildtyp in einer bestimmten Zeit durch das Protein 



WO 2004/063359 



PCT/EP2004/000099 



33 

Hydroxylase die umgesetzte Menge p-Carotin oder Cantaxantin bzw. die 
gebildete Menge Zeaxanthin oder Astaxanthin erhfiht. 

Vorzugsweise betragt diese Erhohung der Hydroxylase-Aktivitat minde- 
5 stens 5 %, weiter bevorzugt mindestens 20 %, weiter bevorzugt minde- 
stens 50 %, weiter bevorzugt mindestens 100 %, bevorzugter mindestens 
300 %, noch bevorzugter mindestens 500 %, insbesondere mindestens 
600 % der Hydroxylase-Aktivitat des Wildtyps. 

10 Die Bestimmung der Hydroxylase-Aktivitat in erfindungsgemaBen gene- 
tisch veranderten Organismen und in Wildtyp- bzw. ReferenzOrganismen 
erfolgt vorzugsweise unter folgenden Bedingungen: 

Die Aktivitat der Hydroxylase wird nach Bouvier et al. (Biochim. Biophys. 
15 Acta 1391 (1998), 320-328) in vitro bestimmt. Es wird zu einer bestimmten 
Menge an Organismenextrakt Ferredoxin, Ferredoxin-NADP Oxidoreduc- 
tase, Katalase, NADPH sowie beta-Carotin mit Mono- und Digalaktosyl- 
glyzeriden zugegeben. 

20 Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unter folgenden Bedingungen nach Bouvier, Keller, d'Harlingue und Ca- 
mara (Xanthophyll biosynthesis: molecular and functional characterization 
of carotenoid hydroxylases from pepper fruits (Capsicum annuum L; Bio- 
chim. Biophys. Acta 1391 (1998), 320-328): 

25 

Der in-vitro Assay wird in einem Volumen von 0.250 ml Volumen durchge- 
fuhrt. Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7.6), 0.025 mg Fer- 
redoxin von Spinat, 0.5 Einheiten Ferredoxin-NADP+ Oxidoreduktase von 
Spinat, 0.25 mM NADPH, 0.010 mg beta-Carotin (in 0.1 mg Tween 80 
30 emulgiert), 0.05 mM einer Mischung von Mono- und Digalaktosylglyzeri- 
den (1:1), 1 Einheit Katalyse, 200 Mono- und Digalaktosylglyzeriden, (1:1), 
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0.2 mg Rinderserumalbumin und Organismenextrakt in unterschiedlichem 
Volumen. Die Reaktionsmischung wird 2 Stunden bei 30C inkubiert. Die 
Reaktionsprodukte werden mit organischem Losungsmittel wie Aceton 
oder Ghloroform/Methanol (2:1) extrahiert und mittels HPLC bestimmt. 

5 

Besonders bevorzugt erfolgt die Bestimmung der Hydroxylase-Aktivitat 
unterfolgenden Bedingungen nach Bouvier, d'Harlingue und Camara (Mo- 
lecular Analysis of carotenoid cyclae inhibition; Arch. Biochem. Biophys. 
346(1) (1997) 53-64): 

10 

Der in-vitro Assay wird in einem Volumen von 250 Dl Volumen durchge- 
fUhrt. Der Ansatz enthalt 50 mM Kaliumphosphat (pH 7.6),unterschiedliche 
Mengen an Organismenextrakt, 20 nM Lycopin, 250 Dg an chromoplasti- 
darem Stromaprotein aus Paprika, 0.2 mM NADP+, 0.2 mM NADPH und 1 
15 mM ATP. NADP/NADPH und ATP werden in 10 ml Ethanol mit 1 mg 
Tween 80 unmittelbar vor der Zugabe zum lnkubationsmedium gelost. 
Nach einer Reaktionszeit von 60 Minuten bei 30C wird die Reaktion durch 
Zugabe von Chloroform/Methanol (2:1) beendet. Die in Chloroform extra- 
hierten Reaktionsprodukte werden mittels HPLC analysiert. 

20 

Ein altemativer Assay mit radioaktivem Substrat ist beschrieben in Fraser 
und Sandmann (Biochem. Biophys. Res. Comm. 185(1) (1992) 9-15). 

Die Erhohung der Hydroxylase-Aktivitat kann durch verschiedene Wege 
25 erfolgen, beispielsweise durch Ausschalten von hemmenden Regulati- 
onsmechanismen auf Expressions- und Proteinebene oder durch Erho- 
hung der Genexpression von Nukleinsauren kodierend eine Hydroxylase 
gegenuber dem Wildtyp. 



30 Die Erhohung der Genexpression der NukleinsSuren kodierend eine Hy- 
droxylase gegenuber dem Wildtyp kann ebenfalls durch verschiedene 
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Wege erfolgen, beispielsweise durch Induzierung des Hydroxylase-Gens 
durch Aktivatoren oder durch Einbringen von einer Oder mehrerer Hydro- 
xylase-Genkopien, also durch Einbringen mindestens einer Nukleinsaure 
kodierend eine Hydroxylase in denb Organismus der Gattung Blakesleaa. 

5 

In einer bevorzugten Ausfiihrungsform erfolgt die Erhohung der Genex- 
pression einer Nukleinsaure kodierend eine Hydroxylase durch Einbringen 
von mindestens einer Nukleinsaure kodierend eine Hydroxylase in den 
Organismus der Gattung Blakesleaa. 

10 

Dazu kann prinzipiell jedes Hydroxylase-Gen, also jede Nukleinsaure, die 
eine Hydroxylase und jede Nukleinsaure, die eine p-Cyclase codiert, ver- 
wendet werden. 

15 Bei genomischen Hydroxylase-Sequenzen aus eukaryontischen Quellen, 
die Introns enthalten, sind fur den Fall das der Wirtsorganismus nicht in 
der Lage ist oder nicht in die Lage versetzt werden kann, die entspre- 
chende Hydroxylase zu exprimieren, bevorzugt bereits prozessierte Nu- 
kleinsauresequenzen, wie die entsprechenden cDNAs zu verwenden. 

20 

Ein Beispiel fQr ein Hydroxylase-Gen ist eine Nukleinsaure, kodierend eine 
Hydroxylase aus Haematococcus pluvialis mit der Accession No. 
AX038729 (WO 0061764; Nukleinsaure: SEQ ID NO: 31, Protein: SEQ ID 
NO: 32), aus Erwinia uredovora 20D3 (ATCC 19321, Accession No. . 
25 D90087; Nukleinsaure: SEQ ID NO: 33, Protein: SEQ ID NO: 34) oder Hy- 
droxylase aus Thermus thermophilus (DE 102 34 126.5) kodiert durch die 
Sequenz mit der SEQ ID NO 76. 

sowie Hydroxylasen der folgenden Accession Nummern: 
30 |emb|CAB55626.1, CAA70427.1, CAA70888.1, CAB55625.1, 
AF499108_1, AF315289J, AF296158J, AAC49443.1, NP_194300.1, 
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NP_200070.1, AAG10430.1, CAC06712.1, AAM88619.1, CAC95130.1, 
AAL80006.1, AF162276J, AA053295.1, AAN85601.1, CRTZ_ERWHE, 
CRTZ_PANAN, BAB79605.1, CRTZ_ALCSP, CRTZ_AGRAU, 
CAB56060.1, ZP_00094836.1, AAC44852.1, BAC77670.1, NP_745389.1, 
5 NP_344225.1, NP_849490.1, ZP_00087019.1, NP.503072.1, 
NP_852012.1, NP_1 15929.1, ZP_000 13255.1 

In den erfindungsgemaften bevorzugten transgenen Organismen der Gat- 
tung Blakeslea liegt also in dieser bevorzugten Ausfuhrungsform gegen- 
10 uber dem Wildtyp mindestens ein weiteres Hydroxylase-Gen vor. 

In dieser bevorzugten Ausfuhrungsform weist die genetisch veranderte 
Organismus beispielsweise mindestens eine exogene Nukleinsaure, ko- 
dierend eine Hydroxylase Oder mindestens zwei endogene Nukleinsauren, 
15 kodierend eine Hydroxylase auf. 

Bevorzugt verwendet man in vorstehend beschriebener bevorzugter Aus- 
fOhrungsform als Hydroxylase-Gene Nukleinsauren, die Proteine kodieren, 
enthaltend die Aminosauresequenz SEQ ID NO: 32, 34 oder kodiert durch 

20 die Sequenz mit der SEQ ID NO 76 oder eine von dieser Sequenz durch 
Substitution, Insertion oder Deletion von Aminosauren abgeleitete Se- 
quenz, die eine Identitat von mindestens 30 %, vorzugsweise mindestens 
50 %, bevorzugter mindestens 70%, noch bevorzugter mindestens 80 %, 
am bevorzugtesten mindestens 90%, insbesondere 91%, 92%, 93%, 94%, 

25 95%, 96%, 97%, 98%, 99% auf Aminosaureebene mit der Sequenz 
SEQ. ID. NO: 32, 34 oder kodiert durch die Sequenz mit der SEQ ID NO 
76 und die die enzymatische Eigenschaft einer Hydroxylase aufweisen. 



30 



Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich 
beispielsweise aus verschiedenen Organismen, deren genomische Se- 
quenz bekannt ist, wie vorstehend beschrieben, durch Homologieverglei- 
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che der Aminosauresequenzen oder der entsprechenden ruckubersetzten 
NukleinsSuresequenzen aus Datenbanken mit der SEQ ID. NO: 31, 33 
oder 76 leicht auffinden. 

5 Weitere Beispiele fur Hydroxylasen und Hydroxylase-Gene lassen sich 
weiterhin beispielsweise ausgehend von der Sequenz SEQ ID NO: 31, 33 
oder 76 aus verschiedenen Organismen deren genomische Sequenz nicht 
bekannt ist, wie vorstehend beschrieben, durch Hybridisierungs- und 
PCR-Techniken in an sich bekannter Weise leicht auffinden. 

10 

In einer weiter besonders bevorzugten Ausfuhrungsform werden zur Erho- 
hung der Hydroxylase-Aktivitat Nukleinsauren in Organismen eingebracht, 
die Proteine kodieren, enthaltend die Aminosauresequenz der Hydroxyla- 
se der Sequenz SEQ ID NO: 32, 34 oder kodiert durch die Sequenz mit 
15 der SEQ ID NO 76. 

Geeignete Nukleinsauresequenzen sind beispielsweise durch RQckQber- 
setzung der Polypeptidsequenz gemali dem genetischen Code erhaltlich. 

20 Bevorzugt werden dafur solche Codons verwendet, die entsprechend der 
Organismenspezifischen codon usage haufig verwendet werden. Die co- 
don usage lasst sich anhand von Computerauswertungen anderer, be- 
kannter Gene der betreffenden Organismen leicht ermitteln. 

25 In einer besonders bevorzugten Ausfuhrungsform bringt man eine Nu- 
kleinsaure, enthaltend die Sequenz SEQ. ID. NO: 31, 33 oder 76 in den 
Organismus ein. 

Alle vorstehend erwahnten Hydroxylase-Gene sind weiterhin in an sich 
30 bekannter Weise durch chemische Synthese aus den Nukleotidbausteinen 
wie beispielsweise durch Fragmentkondensation einzelner uberlappender, 
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komplementarer Nukleinsaurebausteine der Doppelhelix herstellbar. Die 
chemische Synthese von Oligonukleotiden kann beispielsweise, in be- 
kannter Weise, nach der Phosphoamiditmethode {Voet, Voet, 2. Auflage, 
Wiley Press New York, Seite 896-897) erfolgen. Die Anlagerung syntheti- 
5 scher Oligonukleotide und Aufftillen von Lucken mithilfe des Klenow- 
Fragmentes der DNA-Polymerase und Ligationsreaktionen sowie allge- 
meine Klonierungsverfahren werden in Sambrook et al. (1989), Molecular 
cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, 
beschrieben. 

10 

Der in der Transformation (i) eingesetzte Vector umfasst daher in weiteren 
Ausfiihrungsformen der Erfindung bevorzugterweise eine Sequenz codie- 
rend fur eine Hydrolase, insbesondere eine Hydroxlase aus Haemato- 
coccus pluvialis mit der SEQ ID NO: 70 oder eine Hydroxlase aus Erwinia 
15 uredova mit der SEQ ID NO: 71. oder eine Hydroxylase aus Thermus 
thermophilus kodiert durch die Sequenz mit der SEQ ID NO 76. 

Vorzugsweise wird durch die Transformation das Gen der Phytoendesatu- 
rase ausgeschaltet. 

20 

Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise fer- 
ner die Expression regelnde und unterstutzende Bereiche, insbesondere 
Promotoren und Terminatoren. 

25 Der in der Transformation (i) eingesetzte Vector enthalt vorzugsweise den 
gpd und/oder den ptefl Promotor und/oder den trpC Terminator. Diese 
haben sich zur Transformation der Blakeslea besonders bewahrt. Auch 
der Einsatz von dem Fachmann gelaufigen "inverted repeats" (IR, Rompp 
Lexikon der Biotechnologie 1992, Thieme Verlag Stuttgart, Seite 407 "In- 

30 vers repetitive Sequenzen") zur Regelung der Expression bzw. Transkrip- 
tion liegt im Rahmen der Erfindung. 
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Vorteilhafterweise weist der im Vector eingesetzte gpd Promotor die Se- 
quenz SEQ ID NO: 1 auf. Vorteilhafterweise weist der im Vector 
eingesetzte trpC Terminator die Sequenz SEQ ID NO: 2 auf. 
5 Vorteilhafterweise weist der im Vector, eingesetzte ptefl Promotor die 
Sequenz SEQ ID NO: 35 auf. 

Insbesondere werden dabei der gpd Promotor und der trpC Terminator 
aus Aspergillus nidulans und der ptefl Promotor aus Blakeslea trispora 
10 eingesetzt. 

Insbesondere enthalt der in der Transformation (i) eingesetzte Vector ein 
Resistenzgen. Bevorzugterweise handelt es sich urn ein Hygromycin- 
Resistenzgen (hph), insbesondere eines aus E. coli. Dieses Resistenzgen 
15 hat sich bei dem Nachweis der Transformation und Selektion der Zellen 
als besonders geeignet herausgestellt. 

Als Promotor fur hph wird also bevorzugt p-gpdA, der Promotor der Glyce- 
rinaldehyd-3-phosphatdehydrogenase aus Aspergillus nidulans genutzt. 
20 Als Terminator fur hph wird bevorzugt t-trpC, der Terminator des Gens 
trpC, codierend fur Anthranilatsynthasekomponenten aus Aspergillus nidu- 
lans genutzt. 

Als Vectoren haben sich Abkommlinge des pBinAHyg Vectors als beson- 
ders geeignet herausgestellt. Der zur Transformation eingesetzte Vector 
umfasst also bevorzugterweise die SEQ ID NO: 3. 
Hinzu kommen je nach gewQnschtem Carotinoid Oder dessen Vorstufe 
eine Sequenz codierend fur eine Hydroxylase, Ketolase, Phytoendesatu- 
rase usw. wie diese zuvor beschrieben wurden. Die Vectoren umfassen 
also in einer Ausfuhrugsform der Erfndung die Sequenz SEQ ID NO: 69 
codierend fur die Phytoendesaturase. Die Vectoren umfassen ferner in 



25 
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einer weiteren Ausfuhrugsform der Erfndung die Sequenz SEQ ID NO: 72 
codierend fur eine Ketolase. Die Vectoren umfassen weiter in einer weite- 
ren Ausfuhrugsform der Erfndung die Sequenz SEQ ID NO: 70 oder 71 
oder 76 codierend fur eine Hydoxylase. Entsprechende Kombinationen 
5 der zuvorgenannten Sequenzen liegen ebenso im Rahmen der Erfindung. 
So umfasst der Vector in einer Ausfuhrungsform sowohl eine Sequenz 
SEQ ID NO: 72 codierend fur eine Ketolase als auch die Sequenz SEQ ID 
NO: 70 oder 71 oder 76 codierend fur eine Hydoxylase und ermdglicht so 
die Herstellung von Astaxanthin. 

10 

Insbesondere sind Vectoren ausgewahlt aus der Gruppe bestehend aus 
den SEQ ID NO: 37 bis 51 und 62 im Rahmen der Erfindung einsetzbar. 

Die genetisch veranderten Organismen konnen zur Produktion von Caroti- 
15 noiden, Xanthophyllen oder deren Vorstufen, insbesondere Bixin, Phy- 
toen, Astaxanthin, Zeaxanthin und Canthaxanthin verwendet werden. 
Auch konnen neue, im Wildtyp natiirlicherweise nicht vorkommende Caro- 
tinoide durch Einbringung der entsprechenden genetischen Information 
von den gezielt genetisch veranderten Zellen bzw. dem durch sie gebilde- 
20 ten Mycel erzeugt und anschlieftend isoliert werden. 

Die gentechnisch verandertern Zellen werden nach der Selektion kultiviert, 
so daft Carotinoiden oder deren Vorstufen bereitgestellt werden konnen. 

25 Bevorzugterweise ist die Gewinnung von Carotinoiden oder deren Vorstu- 
fen mit den gezielt genetisch veranderten Zellen bzw. das durch sie gebil- 
dete Mycel moglich. 

Die Kultivierung der Organismen unterliegt keinen Besonderheiten. Vor- 
30 teilhafterweise werden, insbesondere bei der Verwendung von Blakeslea 
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trispora, entgegengesetzte Paarungstypen gemeinsam kultiviert, da dies 
zu besserem Wachstum und Produktion fuhrt. 

Wird die gentechnische Veranderung nur in Zellen eines der vorkommen- 
5 den Paarungstypen (bei Blakeslea trispora (+) oder (-)) durchgefuhrt, so 
wird zur Kultivierung der entsprechend andere, nicht veranderte Paarungs- 
typ zugesetzt, da so eine gute Produktion der Carotinoide oder deren Vor- 
stufen aufgrund der von dem zweiten, nicht veranderten Paarungstyp ab- 
gegebenen Substanzen (z. B. Trisporsauren) zu erreichen ist. Vorteilhaft- 
w erweise wird jedoch die gentechnische Veranderung in Zellen beider Paa- 
rungstypen vorgenommen und diese zusammen kultiviert. Hierdurch wird 
ein besonders gutes Wachstum und eine optimale Produktion der Caroti- 
noiden oder deren Vorstufen erreicht. Auch eine (kunstliche) Zugabe der 
Trisporsauren ist moglich und sinnvoll. 

15 

Trisporsauren sind Sexualhormone in Mucorales Pilzen, wie Blakeslea, 
welche die Bildung von Zygophoren und die Produktion von P-Carotin sti- 
mulieren (van den Ende 1968, J. Bacteriol. 96:1298 - 1303, Austin et al. 
1969, Nature 223:1178 - 1179, Reschke Tetrahedron Lett. 29:3435 - 
20 3439, van den Ende 1970, J. Bacteriol. 101:423-428). 

Es k6nnen alle dem Fachmann gelaufigen Medien eingesetzt werden, so 
weit sich diese zur Kultivierung der eingesetzten Organismen und deren 
Carotinoid Produktion eigenen. Insbesondere mussen bei Einsatz der 

25 GVO keine Carotinoidbiosynthese Inhibitoren eingesetzt werden. Die ein- 
gesetzten Medien. beinhalten vorzugsweise Zusatze, wie eine oder mehre- 
re Kohlenstoffquellen, eine oder mehrere Stickstoffquellen, Mineralsalze 
und Thiamine. Bevorzugterweise werden Zusatze eingesetzt, wie sie aus 
der WO 03/038064 A2, Seite 4, Zeile 30 bis Seite 5 Zeile 7 hervorgehen. 

30 Besonders bevorzugt wird als Kohlenstoffquelle Glukose und als Stick- 
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stoffquelle Asparagin, pflanzliche Oder tierische Extrakte, wie Baumwoll- 
saatfil, Sojaol, Baumwollsamenmehl oder Hefe-Extrakt zugesetzt. 

Die Kultivierung kann entweder unter aeroben oder anaeroben Bedingun- 
5 gen durchgefGhrt werden. Auch eine gemischte, zunachst aerobe und an- 
schlielJend anaerobe Kultivierung, wie sie aus der DE 101 30 323 bekannt 
ist, ist moglich. Temperatur und Luftfeuchtigkeit werden dabei jeweils zum 
optimalen Wachstum eingestellt. Bevorzugterweise liegt die Temperatur 
bei der Kultivierung zwischen ca. 20 und ca. 34 °C, insbesondere zwi- 
10 schen ca. 26°C und ca. 28°C. Die Kultivierung kann ferner kontinuierlich, 
batch- oder satzweise erfolgen. 

Die Kultivierung erfolgt vorzugsweise bis zu einem Feststoffgehalt zwi- 
schen etwa 1 und etwa 20 %, bevorzugt 3 und 15 % und besonders be- 
15 vorzugt 4 und 1 1 %. Insbesondere ist wichtig dass die KulturbrOhe pump- 
bar bleibt, so dass sie in den nachfolgenden Verfahrensschritten ver- und 
bearbeitbar bleibt. Ist der Feststoffgehalt zu klein, so muss ein grofcer 
Aufwand bei der Aufkonzentrierung oder Trocknung betrieben werden. 

20 Die Kultivierung bzw. Fermentation kann in den ublichen Apparaturen 
durchgefuhrt werden. Hierzu kommen alle fur die jeweils eingesetzten Mi- 
kroorganismen und deren Produkte geeigneten Apparaturen in Betracht. 
Insbesondere solche, wie sie aus dem Rompp Lexikon Biotechnologie 
(1992 Georg Thieme Verlag, Stuttgart) unter dem Stichwort "Bioreaktor" 

25 auf Seiten 123-126 angegeben sind. Besonders bevorzugt ist der Einsatz 
von ROhrkesselreaktoren mit versch. Einbauten, Blasensaulen verschie- 
dener Bauarten, etc. 

Die nach dem erfindungsgemallen Verfahren bereitgestellten Carotinoiden 
30 oder deren Vorstufen, insbesondere Bixin, Phytoen oder Xanthophylle, 
besonders bevorzugt Astaxanthin oder Zeaxanthin eignen sich besonders 
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zur Herstellung von Zusatzen fur Futter-, Nahrungs- und Nahrungsergan- 
zungsmittel, kosmetischen, pharmazeutischen oder dermatologischen Zu- 
bereitungen. 

Die Bereitstellung des von den gentechnisch veranderten Zellen produ- 
zierten Carotinoids oder der von den gentechnischen veranderten Zellen 
produzierten Carotinoidvorstufe aus der Kultur der gentechnisch verander- 
ten Mikroorganismen erfolgt nach zwei Varianten a) oder b), becorzugt ist 
auch eine Kombination aus a) und b); 



a: 



I) Abtrennung der Biomasse, 

IA) ggf. Waschen der Biomasse mit einem Carotinoide 
nicht losenden Losungsmittel, insbesondere Wasser, 
15 IB) Sterilisation und Zellaufschlufc der Biomasse, 

IC) ggf. Trocknung und/oder homogene Verteilung und 

II) partielle Extraktion der Carotinoide aus der aufgeschlosse- 
nen Biomasse mittels eines Carotinoide losenden Losungs- 
mittels und Trennung des Losungsmittels von der Biomasse, 

20 IIA) 

1) Entfernung von Losemittelresten aus der Carotinoid- 
haltigen Biomasse, 

2) ggf. homogene Suspension der Biomasse mit einem 
Biomasse-Feststoffgehalt > 2 % und < 50 %, und 

25 3) Trocknung der Biomasse bzw. Suspension zur Her- 

stellung des Nahrungsmittels, 

IIB) 

1) Kristallisation der Carotinoide aus dem verwendeten Lo- 
sungsmittel und Isoiierung der Carotinoid-Kristalle, insbe- 
30 sondere durch Filtration; 
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oder b): 



I) Homogene Suspendierung der Feststoffe der Kulturbruhe 
5 und 

1 1 A) bei einem Feststoffgehalt der Kulturbruhe von > 2 % 

1) ggf. Konzentration der Kulturbruhe auf einen Fest- 
stoffgehalt < 50 % und 

10 2) Trocknung der Kulturbruhe zur Herstellung des Nah- 

rungsmittels 

oder 

IIB) bei einem Feststoffgehalt von < 2 % der Kulturbruhe, 
15 1) Konzentration der Kulturbruhe auf einen Feststoffge- 

halt > 2 % und < 50 % und 

2) Trocknung der Suspension zur Herstellung des Nah- 
rungsmittels, 



20 



oder 



IIC) unabhangig vom Feststoffgehalt der Kulturbruhe, 

1 ) Abtrennung der Biomasse, 

2) ggf. Waschen der Biomasse mit Carotinoide nicht lo- 
senden Losungsmitteln, insbesondere Wasser, 

25 3) Sterilisation und Zellaufschlufc, 

4) ggf. Trocknung und homogene Verteilung, 

5) partielle Extraktion der Carotinoide aus der Biomasse 
mittels eines Carotinoide losendes Losungsmittels, 

5a) Abtrennung der Carotinoid-haltigen Biomasse vom 
30 Carotinoid-haltigen Losungsmittel, 
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5b) Entfernung von Losemittelresten aus der Biomasse 
und 

5c) Trocknung der Biomasse zur Herstellung des Nah- 
rungsmittels, 

5 6) Kristallisation der Carotinoide aus dem in 5a) verwen- 

deten LSsungsmittel und Isolierung der Carotinoid- 
Kristalle, insbesondere durch Filtration. 

10 Die erfindungsgemafte Bereitstellung des von den gentechnisch verander- 
ten Zellen produzierten Carotinoids oder der von den gentechnischen ver- 
anderten Zellen produzierten Carotinoidvorstufe aus der Kultur der gen- 
technisch veranderten Mikroorganismen erfolgt nach zwei Varianten a) 
Oder b) ermoglicht die gleichzeitige Herstellung von zwei Produkten. 

15 

Durch die erfindungsgemafce ^Combination der Herstellung von zwei Pro- 
dukten, insbesondere bei der Bereitstellung gemafc Variante a), namlich 
dem mindestens einem Carotinoid und dem Carotinoid-haltigem Nah- 
rungsmittel ist keine vollstandige Extraktion der Carotinoide aus der Bio- 

20 masse n6tig, so dass der Aufwand bei der Extraktion geringer ausfallt. Das 
Carotinoid muss trotz vollstandiger Verwertung nur partiell extrahiert wer- 
den, ohne dass es zu Produktverlusten kommt. Dies bedingt geringere 
Losungsmittelmengen und damit einhergehend einen geringeren Aufwand 
bei den Maftnahmen zu deren Wiederverwendung. Zudem werden Abfalle 

25 weitestgehend vermieden, da die Biomasse nicht als Abfall anfallt, son- 
dern zum hochwertigen Nahrungsmittel weiterverarbeitet wird. Somit er- 
geben sich geringere Kosten fur die Verfahren durch Ausnutzen von Syn- 
ergien. 

30 Nach dem erfindungsgemalien Verfahren mit Bereitstellung gemaR Vari- 
ante b) erhaltliche Nahrungsmittel enthalten also bereits nach der Herstel- 
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lung gro&e Mengen an Carotinoiden, die nicht zugesetzt werden mussen. 
Dadurch, dass das Nahrungsmittel neben dem mindestens einen Caroti- 
noid auch Blakeslea trispora enthalt ist sein NShrstoffgehalt zudem gestei- 
gert. Insbesondere ist der Nahrstoffgehalt nach den bevorzugten Altemati- 

5 ven IIA und MB stark gesteigert, da es neben dem mindestens einen Caro 
tinoid und Blakeslea trispora zusStzlich alle Medienbestandteile der Fer- 
mentation enthalt. Femer benStigt das Verfahren keine zusatzlichen, auf- 
wendigen Aufarbeitungs- und Herstellungsschritte, sondern die homogeni- 
sierte und ggf. entwasserte Blakeslea trispora-haltige Kulturbriihe kann 

10 direkt ohne Umwege zur Herstellung des Nahrungsmittels getrocknet wer- 
den. Es fallen demnach praktisch keine Abfalle an, abgesehen vom wass- 
rigem Medium bei der Alternative IIB, welches jedoch unproblematisch in 
einer Klaranlage gereinigt werden kann. ZusStzlich wird in alien drei Alter- 
nativen die gesamte Produktionsmenge Carotinoide ohne oder mit nur 

15 marginalen Verlusten verwertet, da gemali IIA und IIB keine verlustreichen 
Trenn- bzw. Aufarbeitungsschritte vorgenommen werden miissen. Bei der 
Alternative IIIC wird ebenfalls die gesamte Produktionsmenge Carotinoide 
ohne oder mit nur marginalen Verlusten verwertet, da ein Teil in der Bio- 
masse zum Nahrungsmittel verarbeitet wird und der andere Teil zur Ge- 

20 winnung reiner Carotinoide extrahiert wird. Durch die erfindungsgemalie 
Kombination der Herstellung von zwei Produkten gemali IIC, namlich dem 
Carotinoid-haltigem Nahrungsmittel und den Carotinoiden an sich, ist vor- 
teilhaft, dass wiederum im wesentlichen keine Abfalle entstehen und eine 
vollstandige Extraktion der Carotinoide aus der Biomasse unnotig ist, so 

25 dass sonst bei der Extraktion anfallende Aufwand geringer ausfallt. Das 
oder die wertvollen Carotinoide mussen trotz vollstandiger Verwertung nur 
partiell extrahiert werden, ohne dass es zu Produktverlusten kommt. Dies 
bedingt geringere Losungsmittelmengen und damit einhergehend einen 
geringeren Aufwand bei den MafJnahmen zu deren Wiederverwendung. 

30 Zudem werden Abfalle weitestgehend vermieden, da die Biomasse nicht 
als Abfall anfallt, sondern zum hochwertigen Nahrungsmittel verarbeitet 
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wird. Somit ergeben sich geringere Kosten fur die Verfahren durch Aus- 
nutzen von Synergien. 

Unter "hochrein" soil in der vorliegenden Anmeldung eine Reinheit des 
5 mindestens einen Carotinoids von mindestens 95%, bevorzugt > 95%, 
vorzugsweise > 96%, besonders bevorzugt > 97%, ganz besonders be- 
vorzugt > 98%, hochst bevorzugt > 99% verstanden werden. 

Als nach dem erfindungsgemaRen Verfahren herstellbare Carotinoide 
10 kommen aile naturlichen und kunstlichen Carotine und Xanthophylle in 
Betracht Insbesondere ist das mindestens eine Carotinoid aus der Grup- 
pe bestehend aus Astaxanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, 
Andonixanthin, Adonirubin, Canthaxanthin, 3-Hydroxyechinenon, 
3 f -Hydroxyechinenon, Lycopin, p-Carotin, Lutein, Phytofluen, Bixin und 
15 Phytoen ausgewShlt. Bevorzugterweise handelt es sich urn Astaxanthin 
oder Zeaxanthin. Die Carotinoide konnen nach dem erfindungsgemaRen 
Verfahren einzeln oder als Gemische von zwei oder mehrerer der zuvor 
genannten Carotinoide erhalten werden. Insbesondere bei Einsatz der 
weiter unten angegebenen gentechnisch veranderten Organismen (GVO) 
20 kann das oder konnen die Carotinoide gezielt hergestellt werden. 

Als Nahrungsmittel werden Zusammensetzungen angesehen, die der Er- 
nahrung dienen. Darunter fallen auch Zusammensetzungen fur die Ergan- 
zung der Ernahrung. Insbesondere werden als Nahrungsmittel Tierfutter- 
25 mittel und Tierfuttererganzungsmittel angesehen. 

Nach der Kultivierung kann, gemali Variante a) der Bereitstellung, die 
Biomasse von der Kulturbruhe abgetrennt. Hierzu konnen alle dem Fach- 
mann gelaufigen und ublicherweise einsetzbaren Methoden zur 
30 fest/f lussig-Trennung eingesetzt werden. Hierunter fallen insbesondere die 
mechanischen Verfahren, wie Filtration und Zentrifugation, die auf der 
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Ausnutzung von Schwerkraft, Zentrifugalkraft, Druck oder Vakuum beru- 
hen. Zu den einsetzbaren Verfahren und Apparaten gehbren daneben 
u. a. Querstromfiltration bzw. Mebrantechniken wie Osmose, umgekehrte 
Osmose, Mikrofiltration, Ultrafiltration, Nanofiltration, Kuchenfiltrationsver- 

5 fahren (z.B. mittels Pressfilterautomaten, (Membran-, Rahmen- oder 
Kammer-)Filterpressen, (RQhr-)drucknutschen, Saugnutschen, (Vakuum- 
)bandfiltern, (Vakuum-)Trommelfiltern, Drehflltern, Kerzenfiltern), Zentrifu- 
gationsverfahren mittels kontinuierlich oder diskontinuierlich betriebener 
Zentrifugen oder Filterzentrifugen (z.B. Stiilpfilterzentrifugen, Schalzentri- 

10 fugen, Schubzentrifugen, Siebschneckenzentrifugen, Gleitzentrifugen, Se- 
paratoren oder Dekantern), Verfahren unter Ausnutzung der Schwerkraft 
wie Flotation, Sedimentation, Sink-Schwimm-Aufbereitung und Klaren. 
Bevorzugterweise erfolgt die Abtrennung der Biomasse von der KulturbrD- 
he durch Zentrifugation mittels eines Dekanters oder durch Filtration, mit- 

15 tels einer Mebranfiltrationseinheit durchgefuhrt. 

In dem zweiten Schritt der Bereitstellung nach Variante b) wird eine ho- 
mogen verteilte Suspension der Feststoffe in der Kulturbrtlhe erzeugt. 
Hierzu konnen alle dem Fachmann gelaufigen und ublicherweise einsetz- 
20 baren Methoden verwendet werden. Insbesondere kommen dazu Disper- 
giergerate, wie ein Ultra-Turrax® (im LabormaRstab) zum Einsatz. Ein 
Zellaufschluss ist nicht notwendig, kann aber vorgenommen werden. 

Falls notwendig, kann die Kulturbriihe entwassert werden, urn einen ge- 
25 eigneten Feststoffgehalt zwischen > 2 % und < 50 % zu erreichen. Hierzu 
k6nnen alle dem Fachmann gelaufigen und Ublicherweise einsetzbaren 
Methoden zur fest/flussig-Trennung eingesetzt werden. Hierunter fallen 
insbesondere die mechanischen Verfahren, wie Filtration und Zentrifugati- 
on, die auf der Ausnutzung von Schwerkraft, Zentrifugalkraft, Druck oder 
30 Vakuum beruhen. Zu den einsetzbaren Verfahren und Apparaten gehoren 
daneben u. a. Querstromfiltration bzw. Mebrantechniken wie Osmose, 
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umgekehrte Osmose, Mikrofiltration, Ultrafiltration, Nanofiltration, Kuchen- 
filtrationsverfahren (z.B. mittels Pressfilterautomaten, (Membran-, Rah- 
men- oder Kammer-)Filterpressen, (Ruhr-)drucknutschen, Saugnutschen, 
(Vakuum-)bandfiltern, (Vakuum-)Trommelfiltern, Drehfiltern, Kerzenfiltern), 

5 Zentrifugationsverfahren mittels kontinuierlich oder diskontinuierlich be- 
triebener Zentrifugen oder Filterzentrifugen (z.B. Stulpfilterzentrifugen, 
Schalzentrifugen, Schubzentrifugen, Siebschneckenzentrifugen, Gleitzen- 
trifugen, Separatoren oder Dekantern), Verfahren unter Ausnutzung der 
Schwerkraft wie Flotation, Sedimentation, Sink-Schwimm-Aufbereitung 

10 und Klaren. Bevorzugterweise erfolgt die Abtrennung der Biomasse von 
der Kulturbruhe durch Zentrifugation mittels eines Dekanters oder wird 
durch Filtration, mittels einer Mebranfiltrationseinheit durchgefuhrt. An- 
schliefcend wird die Kulturbruhe getrocknet. Hierzu konnen wiederum alle 
dem Fachmann bekannten Verfahren und Apparate eingesetzt wer- 

15 den.lnsbesondere eignen sich Apparate zur thermischen Trocknung wie 
Konvektions-, Kontakt- und Strahlungstrocknung, z.B. Horden-, Kammer-, 
Kanal-, Flachbahn-, Teller-, Drehtrommel-, Rieselschacht-, Siebband-, 
Strom-, , Wirbelschicht-, Fliefibett-, Schaufel-, Kugelbett-, , Heizteller-, 
Dunnschicht-, Walzen-, Band-, Siebtrommel-, Schnecken-, Taumel-, Kon- 

20 takt-Scheiben-, Infrarot-, Mikrowellen- und Gefriertrockner, Spruhtrockner 
oder Spruhtrockner mit integrierter Wirbelschicht, die durch Dampf, Ol, 
Gas oder elektrischen Strom ggf. beheizt und ggf. unter Vakuum betrieben 
werden. Die Betriebsweie kann dabei je nach Apparat kontinuierlich oder 
diskontinuierlich sein. Daneben oder damit in Kombination konnen die 

25 oben bereits angegeben mechanischen Verfahren zur Fest/flussig- 
Trennung verwendet werden. 

Eine Granulierung durch Extrusion wie dies aus der WO 97/36996 A2 her- 
vorgeht ist jedoch nicht notwendig. Durch die Trocknung wird das Nah- 
rungsmittel haltbar und lagerfahig. 
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Insbesondere wird die Kulturbriihe spriihgetrocknet. Bevorzugt wird zur 
Trocknung die Spruhtrocknung eingesetzt, wie sie aus der DE 101 04 494 
A1, DE-A-12 11 911 Oder EP 0 410 236 A1 bekannt sind. Erganzend wird 
auf vgl. Rompp Lexikon Chemie CD-ROM Version 2.0, Georg Thieme Ver- 
5 lag, 1999, "Spruhtrocknung" und R6mpp Lexikon Biotechnologie, Georg 
Thieme Verlag, 1992, "Zerstaubungstrocknung" verwiesen. Die Spruh- 
trocknung bietet den Vorteil der kurzen Verweilzeit des Produkts in der 
heiften Zone des Trockners, so dass eine besonders schonende Trock- 
nung erzielt wird. 

10 

Bei der Spruhtrocknung werden Eingangstemperaturen von ca. 115°C - 
180°C, bevorzugt 120°C -130°C, und Ausgangstemperaturen von ca. 
50°C - 80°C, bevorzugt 55°C - 70°C gewahlt. Als Trocknungsgas wird 
vorzugsweise Stickstoff eingesetzt. 

15 

Gegebenenfalls k8nnen zur Erzielung einer besseren Rieselfahigkeit Rie- 
selhilfsmittel, wie Kieselsauren etc. zugesetzt werden. Der Einsatz von 
inerten Tragermaterialien, d.h. niedermolekularen anorganischen Tragern 
wie NaCI, CaC03, Na2S04 oder MgS04, organischen Tragern wie Glu- 

20 cose, Fructose, Saccharose, Dextrine oder Starkeprodukten (Roggen-, 
Gersten-, Hafermehl, Weizengrielikleie) ist denkbar. 
Das getrocknete Produkt weist bevorzugt eine Restfeuchte von weniger 
als 10 %, bevorzugt weniger als 5 % bezogen auf die Trockenmasse auf. 
Sein Carotinoidgehalt liegt zwischen 0,05 und 20 %, insbesondere 1 und 

25 1 0 % bezogen auf die Trockenmasse. 

Das so hergestellte Nahrungsmittel kann entweder direkt verwendet wer- 
den oder mittels weiterer Zusatze aufbereitet werden, so wie dies eben- 
falls aus der DE 101 04 494 A1 bekannt ist. 



30 
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Gemafi der Alternative IIC wird nach der Kultivierung und vor der Trock- 
nung der Biomasse, die Biomasse von der Kulturbruhe zunachst abge- 
trennt. Hierzu konnen alle dem Fachmann gelaufigen und ublicherweise 
einsetzbaren Methoden zur fest/flussig-Trennung eingesetzt werden, wie 
5 sie bereits oben bei der Entwasserung genannt wurden. Bevorzugterweise 
erfolgt die Abtrennung der Biomasse von der Kulturbruhe durch Zentrifu- 
gation mittels eines Dekanters oder durch Membranfiltration durchgefuhrt 

AnschliefJend erfolgt optional das Waschen der Biomasse mit einem Caro- 
w tinoide nicht lOsenden Losungsmittel, insbesondere Wasser, wodurch ins- 
besondere Wasser losliche Komponenten entfernt werden. Dieser Schritt 
kann gegebenenfalls unter Verwendung weiterer Carotinoide nicht losen- 
den Losungsmittel (z. B. Alkohole) erganzt werden, was aber im Rahmen 
der Erfindung nicht notwendig ist und zur Vermeidung von Abfallen nicht 
15 bevorzugt ist. 

Anschiiefiend erfolgen die Sterilisation und der sich anschlieRende oder 
gleichzeitige ZellaufschluB der Zellen in der Biomasse. Durch die Sterilisa- 
tion werden die Mikroorganismen abgetotet und gegebenenfalls vorhan- 
20 dene Enzymaktivitat beendet. Dies ist zur Verhinderung des Abbaus der 
Biomasse bzw. der darin enthaltenen Stoffe, insbesondere der Carotinoide 
und fur die Haltbarkeit von Bedeutung. 

Die Sterilisation kann mit einem ublichen, dem Fachmann gelaufigen Ver- 
25 fahren durchgefuhrt werden. Hierzu gehoren die Sterilisation mittels 
Dampf, insbesondere bei Temperaturen grOfier 120 °C unter Druck (> 1 
bar) und Zeitdauern von > ca. 20 min. sowie die Behandlung mit energie- 
reichen Strahlen, wie UV-, Mikrowellen, Gamma- oder Beta-Strahlen. Be- 
vorzugterweise erfolgt die Sterilisation im Rahmen des erfindungsgema- 
30 Ben Verfahrens mittels Dampf oder Mikrowellenstrahlung. 



WO 2004/063359 



52 



PCT/EP2004/000099 



Durch den nachfolgenden Oder gleichzeitigen ZellaufschluB, werden die 
innerhalb der Zellen vorliegenden Carotinoide freigesetzt. Der Zellauf- 
schluB kann ebenfalls mit alien dem Fachmann bekannten ublichen Ver- 
fahren erfolgen. Hierzu gehoren mechanische und nicht mechanische Me- 
5 thoden. Zu den mechanischen Methoden zahlen Trockenmahlen, Nali- 
mahlen, Ruhren, Homogenisieren (z.B. im Hochdruckhomogenisator) und 
die Verwendung von Ultraschall oder Mikrowellen. Als nicht mechanische 
Methoden kommen physikalische, chemische und biochemische Metho- 
den in Betracht. Hierzu gehfiren Kurzzeiterhitzen, Kurzzeitgefrieren, Os- 
lo motischer Schock, Trocknung, Behandlung mit Sauren oder Laugen sowie 
ein enzymatischer Aufschluss. Giinstiger Weise wird zum Zellaufschluss 
jedoch das zur Sterilisation verwendete Verfahren eingesetzt. Bevorzug- 
terweise wird also ebenfalls der Zellaufschluss mittels Dampf oder Mikro- 
wellen Strahlung durchgefuhrt. 

15 

Die Sterilisation und/oder der Zellaufschluss konnen kontinuierlich oder 
diskontinuierlich durchgefuhrt werden. 

Die Sterilisation und/oder der Zellaufschluss konnen im zur Kultivierung 
20 eingesetzten Bioreaktor oder in anderen Apparaturen, wie Autoklaven 
usw. durchgefuhrt werden. Bei kontinuierlicher Durchfuhrung kann das aus 
der WO 01/83437 A1 bekannte Mikrowellen verwendende Verfahren und 
entsprechende Apparaturen eingesetzt werden. 

25 Vor der Extraktion wird die Biomasse gegebenenfalls getrocknet und/oder 
homogenisiert. Hierzu konnen wiederum alle dem Fachmann bekannten 
ublichen Verfahren und Gerate eingesetzt werden. Insbesondere eignen 
sich Apparate zur thermischen Trocknung wie Konvektions-, Kontakt- und 
Strahlungstrocknung, z.B. Horden-, Kammer-, Kanal-, Flachbahn-, Teller-, 

30 Drehtrommel-, Rieselschacht-, Siebband-, Strom-, , Wirbelschicht-, FlieR- 
bett-, Schaufe!-, Kugelbett-, , Heizteller-, DCinnschicht-, Walzen-, Band-, 
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Siebtrommel-, Schnecken-, Taumel-, Kontakt-Scheiben-, Infrarot-, Mikro- 
wellerv und Gefriertrockner, Spruhtrockner oder Spruhtrockner mit inte- 
grierter Wirbelschicht, die durch Dampf, 01, Gas oder elektrischen Strom 
ggf. beheizt und ggf. unter Vakuum betrieben werden. Die Betriebsweise 
5 kann dabei je nach Apparat kontinuierlich oder diskontinuierlich sein. 
Daneben oder damit in Kombination konnen die oben bereits angegeben 
mechanischen Verfahren zur Fest/flussig-Trennung verwendet werden. 

Eine Granulierung durch Extrusion wie dies aus der WO 97/36996 A2 her- 
10 vorgeht ist jedoch nicht notwendig. 

Anschliefiend erfolgt die partielle Extraktion der Carotinoide aus der auf- 
geschlossenen Biomasse mittels eines Carotinoide losenden LSsungsmit- 
tels und Trennung des Losungsmittels von der Biomasse. Sowohl in dem 
15 Losungsmittel als auch in der Biomasse sind nun Carotinoide enthalten, 
wobei sich in dem Losungsmittel bevorzugterweise der Groftteil der Caro- 
tinoide befindet. 

Aus dem Losungsmittel werden anschliefiend die hochreinen Carotinoide 
20 isoliert, wohingegen die Biomasse zu einem hochwertigen, Carotinoid- 
haltigen Nahrungsmittel weiterverarbeitet wird, welches durch den vorher- 
gehenden Zellaufschluss auch eine gute Bioverfugbarkeit der Carotinoide 
aufweist 

25 Unter partieller Extraktion soli demnach die bewusst unvollstandige 
Extraktion der Carotinoiden aus der Biomasse verstanden werden (vgl. 
oben). Bevorzugterweise wird im Rahmen der Erfindung durch die Extrak- 
tion also weniger als 100 % der in der Biomasse enthaltenen Gesamt- 
menge der Carotinoide aus dieser extrahiert. 

30 Dies ist von grofiem Vorteil, da der Aufwand zur Extraktion mit der ab- 
nehmenden Menge Carotinoid in der Biomasse uberproportional zunimmt 
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Zur Extraktion werden Losungsmittel eingesetzt, die Carotinoide losen, wie 
z. B. Hexan, Ethylacetat, Dichlormethan oder uberkritisches Kohlendioxid. 
Bevorzugterweise wird erfindungsgemaS als Losungsmittel Dichlormethan 

5 oder uberkritisches Kohlendioxid eingesetzt, wobei beim Einsatz von 
uberkritischem Kohlendioxid die darin enthaltenen Carotinoide anschlie- 
liend in Dichlormethan uberfuhrt werden kSnnen oder das Wertprodukt 
direkt durch Entspannung des Kohlendioxids gewonnen werden kann. 
Dabei werden die Mengen der LSsungsmittel und Durchmischungszeiten 

10 derart gewahlt, dass die gewtinschte Menge Carotinoide aus der Bio- 
masse extrahiert wird. Insbesondere wird der Extraktionsschritt nur einmal 
durchgefiihrt, was technisch und wirtschaftlich sinnvoll ist (vgl. oben). 

Zur Durchfuhrung der Extraktion konnen alle ublichen Verfahren und Ap- 
15 paraturen eingesetzt werden. Insbesondere wird bei nicht getrockneter, 
aber aufgeschlossener Biomasse eine flussig/flussig (Carotinoid liegt in 
fliissigen Zellbestandteilen gelost vor und wird daraus extrahiert und bei 
getrockneter Biomasse eine fest/flussig Extraktion durchgefuhrt. Es kOn- 
nen Kalt- und Heifiextraktion in bestimmten Temperaturbereichen, sowohl 
20 kontinuierliche (z.B. Soxhlet-Extraktion, Perforation und Perkolation) als 
auch diskontinuierliche Verfahren, zu denen beispielsweise Ausschutteln, 
Auslaugen, Auskochen und Digerieren gehoren, verwendet werden. Sie 
konnen auch im Gegenstromverfahren durchgefuhrt werden. 

25 Fur die flussig/flussig Extraktion k6nnen beispielsweise Blasensaulen, , 
pulsierende Kolonnen, Kolonnen mit rotierenden Einbauten, Mixer-Settler- 
Batterien oder Ruhrkessel usw. verwendet werden. 

Die fest/flussig Extraktion kann mittels ublicher Apparaturen durchgefuhrt 
30 werden. Vorzugsweise werden Ruhrkessel oder Mixer-Settler-Apparate 
eingesetzt. 
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Alternate kann der ZellaufschluS ohne vorherige Abtrennung des Fermen- 
taionsmediums erfolgen und sich dann eine direkte Trennung einer sich 
bildenden Carotinoidsuspension von der Biomasse z. B. mittels eines De- 
5 kanters durchgefuhrt werden. Anschlieftend wird die Carotinoidsuspension 
in Dichiormethan aufgenommen und weiterverarbeitet oder alternativ 
durch Waschen mit verschiedenen wassrigen Losungen aufgereinigt. 

Zur Isoiierung der hochreinen Carotinoide aus dem Losungsmittel wird 
10 eine Kristallisation der Carotinoide aus dem verwendeten Losungsmittel 
und Isoiierung der Carotinoid-Kristalle, insbesondere durch Filtration 
durchgefuhrt. Die verbleibende Mutterlauge kann nach Destination dem 
Verfahren erneut zugefiihrt werden, so dass Produktverluste trotz gerin- 
gem Aufwand minimiert werden. 

15 

Die Kristallisation kann wie ublich erfolgen. Erganzend wird auf vgl. 
Rompp Lexikon Chemie CD-ROM Version 2.0, Georg Thieme Verlag, 
1999, "Kristallisation" verwiesen. 

20 Bevorzugterweise erfolgt die Kristallisation durch graduellen Losungsmit- 
telaustausch gegen ein Carotinoide nicht losendes Losungsmittel. Es wird 
also kontinuierlich die Loslichkeit der Carotinoide erniedrigt, bis diese als 
reine Kristalle ausfallen. Hierbei wird vorzugsweise ein "niederer Alkohol" 
oder Wasser verwendet. Als niederer Alkohol werden aliphatische Alkoho- 

25 le mit 1 bis 4 Kohlenstoffatomen angesehen. Hierzu gehoren Methanol, 
Ethanol, Propanol, Isopropanol, 1-Butanol, tert.-Butanol und sec.-Butanol. 
Bevorzugterweise wird Methanol eingesetzt. 

Die Carotinoid-Losung kann dabei erwarmt werden, wobei die Temperatur 
30 vorzugsweise < 100 °C, insbesondere < 60 °C gehalten wird, so dass 
Dichiormethan abdestilliert wird. Auch der Einsatz von Vakuum ist denk- 
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bar. Anschliefcend werden die CarotinoidKristalle isoliert, welches durch 
ubiiche Malinahmen, insbesondere durch Filtration erfolgen kann. Es kon- 
nen sich, falls gewunscht, weitere optionale Trocknungs- und/oder Reini- 
gungsschritte anschlieften. Notwendig sind diese jedoch nicht, da die Ca- 
5 rotinoid Kristalle bereits hochrein sind. 

Die Carotinoide fallen als hochreine Kristalle an und weisen eine Reinheit 
von mindestens 95%, bevorzugt > 95%, vorzugsweise > 96%, besonders 
bevorzugt > 97%, ganz besonders bevorzugt > 98%, hochst bevorzugt > 
10 99% auf. 

Die erzielbaren Ausbeuten liegen zwischen 45% und 95%, bevorzugt zwi- 
schen 70% und 95% bezogen auf die in der Kulturbruhe vorliegende Men- 
ge (0,5 -15 g/L, bevorzugt 1-10 g/L). 

15 

Zur Weiterverarbeitung der ebenfalls Carotinoid-haltigen Biomasse zu ei- 
nem hochwertigen Nahrungsmittel wird zunachst eine Entfernung von L6- 
semittelresten aus der Carotinoid-haltigen Biomasse vorgenommen. Hier- 
zu erfolgt bevorzugterweise eine Wasserdampfdestillationen bzw. ein so 
20 genanntes Strippen mit Wasserdampf (vgl. Rompp Lexikon Chemie CD- 
ROM Version 2.0, Georg Thieme Verlag, 1999, "Strippen"). 

Danach kann gegebenenfalls die Biomasse in der oben abgetrennten Kul- 
turbruhe homogen suspendiert werden, wobei ein Feststoffgehalt > 100 

25 g/L und < 600 g/L eingehalten werden sollte, so dafi die nachfolgende 
Trocknung der Biomasse bzw. Suspension zur Herstellung des Nah- 
rungsmittels ohne technische Schwierigkeiten erfolgen kann. D.h. die Sus- 
pension muR pumpbar sein. Als Trocknungsverfahren kommen alle bereits 
genannten Verfahren und Apparaturen in Frage. Insbesondere wird zur 

30 Trocknung die Spruhtrocknung eingesetzt. Dabei .kann wie aus der DE 
101 04 494 A1 bekannt verfahren werden. 
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Bei der Spruhtrocknung werden Eingangstemperaturen von ca. 100°C - 
180°C, bevorzugt 120°C -130°C, und Ausgangstemperaturen von ca. 50 - 
80°C, bevorzugt 55°C - 70°C gewahlt. Als Trocknungsgas wird vorzugs- 
5 weise Stickstoff eingesetzt. 

Das so hergestellte Nahrungsmittel kann entweder direkt verwendet wer- 
den oder mittels weiterer ZusStze aufbereitet werden, so wie dies eben- 
falls aus der DE 101 04 494 A1 bekannt ist. 

10 

Als Nahrungsmittel werden Zusammensetzungen angesehen, die der Er- 
nahrung dienen. Darunter fallen auch Zusammensetzungen fur die Ergan- 
zung der Ernahrung. Insbesondere werden als Nahrungsmittel Tierfutter- 
mittel und Tierfuttererganzungsmittel angesehen. Erganzend wird auf 
15 RGmpp Lexikon Chemie CD-ROM Version 2.0, Georg Thieme Verlag, 
1999, "Nahrungsmittel" verwiesen. 

Das trockene Produkt weist bevorzugt eine Restfeuchte von weniger als 5 
% bezogen auf die Trockenmasse auf. Sein Carotinoidgehalt liegt zwi- 
20 schen 0,05 und 20 %, insbesondere 1 und 10 % bezogen auf die Trok- 
kenmasse. Der gewunschte Carotinoidgehalt ist uber das Ausmaft der 
Extraktion steuerbar (vgl. oben). 

Nach dem erfindungsgemafien Verfahren erhaltliche Nahrungsmittel ent- 
25 halten also bereits nach der Herstellung grofie Mengen an Carotinoiden, 
die nicht zugesetzt werden mussen. Dadurch, dass das Nahrungsmittel 
neben dem mindestens einen Carotinoid auch Biomasse enthalt ist sein 
Nahrstoffgehalt zudem gesteigert. Insbesondere ist der Nahrstoffgehalt 
nach der bevorzugten Alternative stark gesteigert, im dem es neben dem 
30 mindestens einen Carotinoid und Biomasse zusatzlich alle Medienbe- 
standteile der Fermentation enthalt. Es fallen demnach praktisch keine 
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Abfalle an, abgesehen von wassrigen Medien, welche jedoch unproblema- 
tisch in einer Klaranlage gereinigt .werden konnen. Zusatzlich wird die ge- 
samte Produktionsmenge Carotinoide ohne Oder mit nur marginalen Ver- 
lusten verwertet, da keine verlustreichen Trenn- bzw. Aufarbeitungsschrit- 
5 te vorgenommen werden mussen, urn die gesamte Menge Carotinoid zu 
extrahieren. 

Die in dem oben beschriebenen, erfindungsgemafien Verfahren einge- 
setzten L6sungsmittel werden alle soweit wie m6glich aufbereitet und an- 

10 schlieliend wieder verwendet bzw. dem Verfahren erneut zugefuhrt. Ins- 
besondere wird das eingesetzte Dichlormethan bereits beim Losungmitte- 
laustausch gereinigt und steht anschlieliend zur erneuten Verwendung 
bereit. Der niedere Alkohol bzw. das Methanol wird z. B. destillativ gerei- 
nigt und ebenfalls wieder verwendet. Als Abfall fallen lediglich der Destilla- 

15 tionssumpf an, der zusammen mit den wassrigen Medien gefahrios einer 
Klaranlage zugefuhrt werden kann, wo letztendlich nur eine geringe Men- 
ge Klarschlamm als tatsachlicher Abfall anfallt. Somit ist das beschriebene 
Verfahren im wesentlichen abfallfrei. 



Die Erfindung wird nachfolgend an Hand von Beispielen naher ausgefuhrt. 



25 A) Kultivieruna von Bla keslea trispora 

Folgende Medien wurden zur Fermentation von Blakeslea trispora zur 
Produktion der Carotinoide eingesetzt: 
Medium 1: 



20 



Glucose 
30 Baumwollsaatoel 
Sojaoel 



10,00 g/l 
30,00 g/l 
30,00 g/l 
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Dextrin 60,00 g/l 

Baumwollsamenmehl 75,00 g/l 

Triton X 100 1,20 g/l 

Ascorbinsaure 6,00 g/l 

5 Milchsaure 2,00 g/l 

KH 2 P0 4 0,50 g/l 

MnS0 4 xH20 100 mg/l 

Thiamin-HCI 2 mg/l 

Isoniazid (Isonicotinsaurehydrazid) 0,75 g/l 

to Der pH wurde auf 6,5 eingestellt. 

Medium 2: 

Glucose 20 g/l 

Asparagin 2,00 g/l 

75 KH2PO4 5,00 g/l 

MgS0 4 x 7 H 2 0 0,50 g/l 

CaCI 2 28 mg/l 

Thiamin-HCI 1,00 mg/l 

Citronensaure 2,00 mg/l 

20 Fe(N0 3 ) 3 x 9 H 2 0 1 ,50 mg/l 

ZnS0 4 x7H 2 0 1,00 mg/l 

MnSC-4 x H 2 0 0,30 mg/l 

CuSCv* x 5 H 2 0 0,05 mg/l 

Na 2 Mo0 4 x 2 H 2 0 0,05 mg/l 

25 



Medium 3 
Glucose 
30 Asparagin 
Hefe Extrakt 



70,00 g/l 
2,00 g/l 
1,00 g/l 
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KH2PO4 1,50 g/l 

MgS0 4 x 7 H 2 0 0,50 g/l 

Span 20 1,00 g/l 

Thiamin-HCI 5,0 mg/l 



5 Der pH wurde auf 5,5 eingestellt. 

Mit Sporensuspensionen von Blakeslea trispora ATCC 14272 Mating Type 
(-) die 10 8 (fur Medium 2) bzw. 10 7 (fur Medium 1 und 3) Sporen enthiel- 
ten, wurden je 200 ml der beschriebenen Medien angeimpft. Die Kultivie- 
10 rung erfolgte jeweils in 1-l-Erlenmeyerkolben mit Schikanen. Mit jedem 
Medium wurden sechs identische Kolben angesetzt und uber 7 Tage bei 
28°C und 140 UpM im Schuttler inkubiert. 

B) Gentechnische Veranderunq von Blakeslea Trispora 

15 

Material und Methoden 

Molekulargenetische Arbeiten wurden, wenn nicht anders beschrieben, 
nach den Methoden in Current Protocols in Molecular Biology (Ausubel et 
al., 1999, John Wiley & Sons) durchgefuhrt. 

20 

Stamme und Wachstumsbedingungen 

Die Blakeslea trispora Stamme ATCC 14271 (Paarungstyp(+)) und 
ATCC14272 (-) (ein Wildtyp) wurde erhaltenPaarungstyp (-)) wurden von 
der American Type Culture Collection, erhalten. Die Anzucht von B. trispo- 
25 ra erfolgte in MEP-Medium (Malzextrakt-Pepton-Medium): 30 g/l Malzex- 
trakt (Difco), 3 g/l Pepton (Soytone, Difco), 20 g/l Agar, Einstellung pH 5,5, 
ad 1000 ml mit H 2 0 bei 28 °C. 

Die Anzucht von Agrobacterium tumefaciens LBA4404 erfolgte nach Hoe- 
30 kema et al. (1983, Nature 303:179-180) bei 28 °C fur 24 h in Agrobacteri- 
en-Minimal Medium (AMM): 10 mM K 2 HP0 4 , 10 mM KH 2 P0 4 , 10 mM Glu- 
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cose, MM-Salze (2,5 mM NaCI, 2 mM MgS0 4 , 700 pM CaCI 2 , 9 pM Fe- 
S0 4 , 4 mM (NH 4 ) 2 S0 4 ). 

Transformation von Agrobacterium tumefaciens 

5 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et a!., 1983, Nature 303:179-180) elektroporiert (Mozo and Ho- 
oykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei der 
Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 mg/l 
(Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l (Se- 

10 lektion auf das Helferplasmid) und Kanamycin 100 mg/l (Selektion auf den 
binaYen Vektor). 

Transformation von Blakeslea trispora 

Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
15 auf eine OD 6 oo von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES 
(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 uM Acetosy- 
ringone) verdunnt und erneut iiber Nacht in IM bis zu einer OD 6 oo von ca. 
0,6 angezogen. 

20 Zur Co-lnkubation von Blakeslea ATCC 14271 bzw. ATCC14272 und 
Agrobacterium wurden 100 pi Agrobakteriensuspension mit 100 pi Blakes- 
lea Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und steril 
auf einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose Platten 
(IM + 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C wurde die 

25 Membran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l Pepton, pH 
5,5, 18 g/l Agar) uberfuhrt. Zur Selektion auf transformierte Blakesleazel- 
len enthielt das Medium Hygromycin in einer Konzentration von 100 mg/l 
sowie zur Selektion gegen Agrobakterien 100 mg/l Cefotaxim. Die Inkuba- 
tion erfolgte fur ca. 7 Tage bei 26 °C. Anschlieliend erfolgte der Transfer 

30 von Mycel auf frische Selektionsplatten. Gebildete Sporen wurden mit 
0,9% NaCI abgespult und auf CM17-1-Agar (3 g/l Glucose, 200 mg/l L- 
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Asparagin, 50 mg/l MgS0 4 x 7H 2 0, 150 mg/l KH 2 P0 4 , 25 pg/l ThiaminHCI, 
100 mg/l Yeast Extract, 100 mg/l Na-desoxycholat, 100 mg/L Hygromycin, 
100 mg/L Cefotaxim, pH 5,5,18 g/l Agar) ausplattiert. Zur Isolierung ein- 
zelner gentechnisch veranderter Sporen wurden die Sporen durch ein 
5 FACS GerSt der Fa. BectonDickson (Modell Vantage+Diva Option) einzeln 
auf Selektivmediurn abgelegt. 

Mutagenese mit MNNG 

Zur Reduzierung der Anzahl von Kernen pro Spore wurde eine Behand- 
10 lung von Sporensuspensionen mit MNNG (N-Methyl-N'-nitro-N- 
nitrosoguanidin) durchgefuhrt. Hierfur wurde zunachst eine Sporensus- 
pension mit 1 x 10 7 Sporen/ml in Tris/HCI-Puffer, pH 7,0 hergestellt. Der 
Sporensuspension wurde MNNG in einer Endkonzentration von 100 pg/ml 
zugegeben. Die Zeit der Inkubation in MNNG wurde so gewahlt, dass die 
15 Oberlebensrate der Sporen ca. 5% betrug. Nach Inkubation mit MNNG 
wurden die Sporen dreimal mit 1g/l Span 20 in 50 mM Phosphatpuffer pH 
7,0 gewaschen und plattiert. 

Selektion homonukleater Zellen 

20 Die Selektion homonukleater Zellen von Blakeslea trispora carB* erfolgte 
analog zum Versuchsprotokoll fur Phycomyces blakesleeanus (Roncero et 
al M 1984, Mutation Research, 125:195-204), modifiziert durch Wachstum 
in Gegenwart von 5-Carbon-5-Deazariboflavin (1 pg/ml) und Hygromycin 
100 (pg/ml). 

25 

Herstellung genetisch veranderter Blakeslea trispora durch Agrobac- 
terium-vermittelte Transformation 
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Herstellung des rekombinanten Plasmids pBinAHyg 

Aus dem Plasmid pANsCosI (Fig.1, Osiewacz, 1994, Curr. Genet. 26:87- 
90, SEQ ID NO: 4) wurde die gpdA-hph-trpC-Kassette als Bglll/Hindlll 
Fragment isoliert und in das mit BamHI/Hindlll geoffnete binare Plasmid 

5 pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 
erhaltene Vektor wurde als pBinAHyg bezeichnet (Fig. 2, SEQ ID NO: 3) 
und enthielt das E. coli Hygromycin-Resistenzgen (hph) unter Kontrolle 
des gpd Promoters (SEQ ID NO: 1) und des trpC Terminators (SEQ ID 
NO: 2) aus Aspergillus nidulans sowie die entsprechenden Borderse- 

10 quenzen, die fOr den DNA-Transfer von Agrobacterium notwendig sind. 
Die in den weiter unten beschriebenen Ausfuhrungsbeispielen genannten 
Vektoren sind Abkommlinge von pBinAHyg. 

Ubertragung von pBinAHyg und Abkommlingen von pBinAHyg in 
15 Agrobacterium tumefaciens 

Nachfolgend wird beispielhaft die Obertragung des Plasmids pBinAHyg in 
Agrobacterien beschrieben. Die Obertragung der Abkommlinge erfolgte 
analog. 

20 Das Plasmid pBinAHyg wurde in den Agrobakterienstamm LBA 4404 
(Hoekema et al., 1983, Nature 303:179-180) elektroporiert (Mozo and Ho- 
oykaas, 1991, Plant Mol. Biol. 16:917-918). Zur Selektion wurden bei der 
Agrobakterienanzucht folgende Antibiotika verwendet: Rifampicin 50 mg/l 
(Selektion auf das A. tumefaciens Chromosom), Streptomycin 30 mg/l (Se- 

25 lektion auf das Helferplasmid) und Kanamycin 100 mg/l (Selektion auf den 
binaren Vektor). 

Ubertragung von pBinAHyg und Abkommlingen von pBinAHyg in 
Blakeslea trispora 

30 Zur Transformation wurden die Agrobakterien nach 24 h Anzucht in AMM 
auf eine OD660 von 0,15 in Induktionsmedium (IM: MM-Salze, 40 mM MES 
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(pH 5,6), 5 mM Glucose, 2 mM Phosphat, 0,5% Glycerol, 200 gM Acetosy- 
ringone) verdunnt und erneut uber Nacht in IM bis zu einer OD660 von ca. 
0,6 angezogen. 

5 Zur Co-lnkubation von Blakeslea trispora (B.t.) und Agrobacterium tume- 
faciens (A.t.) wurden 100 pi Agrobakteriensuspension mit 100 pi Blakeslea 
Sporensuspension (10 7 Sporen/ml in 0,9% NaCI) gemischt und steril auf 
einer Nylon Membran (Hybond N, Amersham) auf IM-Agarose Platten (IM 
+ 18 g/l Agar) verteilt. Nach 3 Tagen Inkubation bei 26 °C wurde die Mem- 

10 bran auf eine MEP-Agarplatte (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5, 18 
g/l Agar) uberfuhrt. 

Zur Selektion auf transformierte Blakeslea-Zellen enthielt das Medium Hy- 
gromycin in einer Konzentration von 100 mg/l sowie zur Selektion gegen 

15 Agrobakterien 100 mg/l Cefotaxim. Die Inkubation erfolgte fur ca. 7 Tage 
bei 26 °C. AnschlieBend erfolgte der Transfer von Mycel auf frische Selek- 
tionsplatten. Gebildete Sporen wurden mit 0,9% NaCI abgespiilt und auf 
CM17-1-Agar (3 g/l Glucose, 200 mg/l L-Asparagin, 50 mg/l MgS0 4 x 
7H 2 0, 150 mg/l KH2P04, 25 pg/l Thiamin-HCI, 100 mg/l Yeast Extract. 

20 1 00 mg/l Na-desoxycholat, pH 5,5, 100 mg/l Cefotaxim, 100 mg/l Hygro- 
mycin, 18 g/l Agar) ausplattiert. Die Dbertragung von Sporen auf frische 
Selektionsplatten wurde dreimal wiederholt. Auf diese Weise wurde die 
Transformante Blakeslea trispora GVO 3005 isoliert. Alternativ erfolgte zur 
Selektion der GVO (gentechnisch veranderten Organismen) die Einzelab- 

25 lage der Sporen durch den BectonDickinson FacsVantage+Diva Option 
auf CM-17 Agar mit 100 mg/l Cefotaxim, 100 mg/l Hygromycin. In diesem 
Fall wurde nur dort Pilzmycel gebildet, wo die Sporen gentechnisch veran- 
dert waren. 



30 



Nachweis der genetischen Veranderung durch Ubertragung von pBi- 
nAHyg und Abkommlingen von pBinAHyg in Blakeslea trispora 
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Nachfolgend wird beispielhaft der Nachweis der Obertragung fur pBinA- 
Hyg in Blakesiea trispora beschrieben. Der Nachweis der Obertragung der 
Abkommlinge erfolgte analog. 

5 200 ml MEP-Medium (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5) wurden mit 
10 5 bis 10 7 Sporen der Transformante Blakesiea trispora GVO 3005 be- 
impft und 7 Tage bei 26 °C mit 200 Upm auf einem Rundschiittler inku- 
biert. Zum Nachweis der erfolgreichen Transformation wurde DNA aus 
dem Mycel isoliert (Peqlab Fungal DNA Mini Kit) und in einer PCR (Pro- 

10 gramm: 94 °C 1 min, dann 30 Zyklen mit 1 min. 94°C, 1 min. 58 °C, 1 min. 
72 °C) eingesetzt. 

Zum Nachweis des Hygromycinresistenzgens (hph) wurden die Primer 
hph-forward (5-CGATGTAGGAGGGCGTGGATA, SEQ ID NO: 5) und 
15 hph-reverse (5'-GCTTCTGCGGGCGATTTGTGT, SEQ ID NO: 6) verwen- 
det. Das erwartete Fragment von hph wies eine LSnge von 800 bp auf. 

Zur Amplifikation des Kanamycinresistenzgens nptlll und damit als Kon- 
trolle auf Agrobakterien wurden die Primer nptlll-forward (5- 
20 TGAGAATATCACCGGAATTG, SEQ ID NO: 7) und nptlll-reverse (5- 
AGCTCGACATACTGTTCTTCC, SEQ ID NO: 8) verwendet. Das erwarte- 
te Fragment von nptlll wies eine Lange von 700 bp auf. 

Zur Amplifikation eines Fragmentes des Glycerinaldehyd-3- 
25 phosphatdehydrogenasegens gpdl und damit als Kontrolle auf Blakesiea 
trispora wurden die Primer MAT292 (5- 
GTGAATGGAAATCCCATCGCTGTC, SEQ ID NO: 9) und MAT293 (5- 
AGTGGGTACTCTAAAGGCCATACC, SEQ ID NO: 10) verwendet. Das 
erwartete Fragment von gpdl wies eine Lange von 500 bp auf. 

30 
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Das Ergebnis der PCR der Blakeslea trispora DNA ist in Fig. 3 anhand 
eines Standard-Gels gezeigt. Die Spuren des Gels wurden folgenderma- 
(len belegt: 

5 1) 100 bp Groftenmarker (100 bp - 1 kb) 

2) B.t. GVO 3005 primer nptlll-for / nptlll-rev 

3) B.t. GVO 3005 primer hph-for / hph-rev 

4) B.t. GVO 3005 primer MAT292 / MAT293 (gpd) 

5) A.t. mit Plasmid pBinAHyg primer nptlll-for / nptlll-rev 
10 6) At. mit Plasmid pBinAHyg primer hph-for / hph-rev 

7) B.t. 14272 WT primer nptlll-for / nptlll-rev 

8) B.t. 14272 WT primer hph-for / hph-rev 

9) B.t. 14272 WT primer MAT292 / MAT293 (gpd) 

15 In der DNA von Blakeslea trispora wurde das Hygromycinresistenzgens 
(hph) und als Positivkontrolle Glycerinaldehyd-3- 
phosphatdehydrogenasegen (gpdl) nachgewiesen. nptlll konnte dem- 
gegenuber nicht nachgewiesen werden. 

20 Somit wurde die genetische VenSnderung von Blakeslea trispora durch 
Agrobacterium-vermittelte Transformation nachgewiesen. 



Isolierung homokaryotischer GVO von Blakeslea trispora: 



25 Herstellung homonukleater Stamme 

Durch erfolgreichen Transfer des Vectors pBinAHyg und Abkommlingen 
von pBinAHyg in Blakeslea trispora entstandenentstehen genetisch ver- 
anderte Organismen. In GVO von Blakeslea trispora. Jedoch liegen in 
Blakeslea liegen in alien Stadien des vegetativen und des sexuellen Zell- 
30 zyklus mehrkernige Zellen vor. Daher erfolgte erfolgt die Insertion der Vec- 
torFremd-DNA in der Regel nur in einem Kern. Ziel ist es aber, dass, 
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Stamme von Blakeslea zu erhalten, bei denen die Insertion der Vector- 
Fremd-DNA in alien Kernen vorliegt, d.h. Ziel ist ein homonukleates re- 
kombinantes Pilzmycel. 

5 Zur Herstellung solcher homokaryotischer Zellen wurden zunachst Spo- 
rensuspensionen der rekombinanten Stamme mit MNNG behandelt. Hier- 
fur wurde eine Sporensuspension mit 1 x 10 7 Sporen/ml in Tris/HCI-Puffer, 
pH 7,0 hergestellt. Der Sporensuspension wurde MNNG in einer Endkon- 
zentration von 100 pg/ml zugegeben. Die Dauer der Inkubation mit MNNG 

10 wurde so gewahlt, dass die Oberlebensrate der Sporen ~5% betrug. Nach 
Inkubation mit MNNG wurden die Sporen dreimal mit 1g/l Span 20 in 50 
mM Phosphatpuffer pH 7,0 gewaschen und plattiert. 

1) Herstellung homonukleater rekombinanter Stamme durch FACS 
15 (fluorescence-activated cell sorting) 

Ein geringer Anteil der Sporen von Blakeslea trispora bzw. der gentech- 
nisch veranderten Stamme von Blakeslea trispora ist von Natur aus ein- 
kemig. Zur Herstellung homonukleater rekombinanter Stamme, die Fremd- 
DNA von pBinAHyg oder pBinAHyg-Abkommlingen enthielten, wurden die 

20 einkemigen Sporen durch FACS aussortiert und auf MEP (30 g/l Malzex- 
trakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 mg/l Cefotaxim und 100 
mg/l Hygromycin plattiert. Die hier gebildten Mycelien waren homonukleat. 
Zur Sortierung mit FACS wurden die Sporen eines 3 Tage alten Ausstri- 
ches mit 10 ml Tris-HCI SOmMol + 0,1% Span20 pro Agar-Platte abge- 

25 schwemmt. Die Sporenkonzentration betrug 0,5 bis 0,8 x 10 7 Sporen pro 
ml. Zu 9 ml Sporensuspension wurden 1ml DMSO und 10 pi Syto 11 
(Farbstoff-Stammlosung in DMSO Molecular Probes Nr.S-7573) zugege- 
ben. Danach wurde 2 h bei 30°C gefarbt Die Selektion und Ablage erfolg- 
te mittels eines Becton Dickinson FacsVantage+Diva Option. Die Selektion 

30 erfolgt zuerst nach GrdfSe, urn einzelne Sporen von Aggregaten und Ver- 
unreinigungen zu trennen. Dann wurden diese Sporen nach ihrer Fluores- 
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zenz (Anregung = 488nm Emission = 530 nm) sortiert abgelegt. Die iinke 
Schulter der GauB-Kurve der Fluoreszenzhaufigkeitsverteilung enthielt die 
einkernigen Sporen. 

5 AnschliefJend wurden die Sporen auf MEP-Agarplatten ausplattiert und 
neue Sporen erzeugt. 

Diese Sporen wurden analog zur Vorschrift von Roncero et al. auf Medium 
mit 5-Carbon-5-deazariboflavin plattiert, das zusatzlich Hygromycin ent- 
10 hielt. 

Hierdurch wurden homokaryonte Zellen des Genotyps hyg R und dar se- 
lektiert. 

15 

2) Herstellung homonukleater Stamme durch Kernreduktion und Se- 
lektion mit FACS 

Zur Reduzierung der Anzahl von Kernen pro Spore wurde vor der Selekti- 
on eine Behandlung von Sporensuspensionen mit MNNG (N-Methyl-N- 
20 nitro~N-nitrosoguanidin) durchgefuhrt, und so durch chemische Mutagene- 
se eine Kernreduktion erzielt. 

Hierfur wurde zunachst eine Sporensuspension mit 1 x 10 7 Sporen/ml in 
Tris/HCI-Puffer, pH 7,0 hergestellt. Der Sporensuspension wurde MNNG 
25 in einer Endkonzentration von 100 pg/ml zugegeben. Die Zeit der Inkuba- 
tioh in MNNG wurde so gewahlt, dass die Oberlebensrate der Sporen ca. 
5% betrug. Nach Inkubation mit MNNG wurden die Sporen dreimal mit 1g/l 
Span 20 in 50 mM Phosphatpuffer pH 7,0 gewaschen und nach der unter 
1) beschriebenen Methode sortiert bzw. selektiert. 

30 
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Alternativ konnten zur Reduktion der Kernzahl in den Sporen auch Ront- 
gen - und UV-Strahlen eingesetzt werden, wie es von Cerda-Olmedo und 
Patricia Reau in Mutation Res., 9 (1970), 369-384 beschrieben wurde. 

5 

3) Herstellung homonukleater Stamme durch Selektion auf rezessive 
Selektionsmarker 

Als rezessiver Selektionsmarker zur Selektion homonukleater Mycelien 
kommt beispielsweise der rezessive Selektionsmarker pyrG in Frage. 

10 Wildtyp-Stamme von Blakeslea trispora sind pyrG + . Diese Stamme konnen 
nicht in Gegenwart des Pyrimidin-Analogs 5-Fluororotat (FOA) wachsen, 
weil sie FOA durch die Orotidin-5'-monophosphatdecarboxylase zu letha- 
len Metaboliten umsetzen. Gentechnisch verSnderte Blakesleaa, die ho- 
monukleat pyrG" sind, fehlt die Enzymaktivitat Orotidin-5'- 

15 monophosphatdecarboxylase. Folglich konnen diese pyrG'-Stamme 5- 
Fluororotat nicht verwerten. Die Stamme wachsen daher in Gegenwart 
von FOA und Uracil. Im Fall der Kopplung der Mutation pyrG" und der In- 
sertion von Fremd-DNA auf dem Kern einer einkemigen Spore, kann aus 
dieser Spore homonukleates rekombinantes Pilzmycel gebildet werden. 

20 

Zunachst wurde durch Insertion eines Fragentes von pyrG (SEQ ID NO: 
65) aus Blakeslea trispora in pBinAHyg das Plasmid pBinAHygBTpyrG- 
SCO (SEQ ID NO: 36, Fig. 4) erzeugt. Dieses Plasmid wurde in Blakelea 
trispora transformiert und fuhrte dort durch homologe Rekombination zur 
25 Disruption von pyrG. 

Homonukleate GVO von Blakeslea trispora mit dem Phanotyp pyrG" wur- 
den folgendermafcen selektiert. Zur Agrobakterium-vermittelten Transfor- 
mation von pBinAHygBTpyrG-SCO wurde wie oben beschrieben auf MEP 
30 (30 g/l Malzextrakt, 3 g/l Pepton, pH 5,5, 18 g/l Agar) mit 100 mg/l Cefota- 
xim und 100 mg/l Hygromycin plattiert. Die Sporen der Transformanten 
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wurden mit 10 ml Tris-HCI 50mM + 0,1% Span20 pro Agar-Platte abge- 
schwemmt. Die Sporenkonzentration betrug 0,5 bis 0,8 x 10 7 Sporen pro 
ml. Die Sporen wurden anschlieliend auf FOA-Medium mit 100 mg/l Cefo- 
taxim und 100 mg/l Hygromycin ausplattiert. FOA-Medium enthielt pro Li- 

5 ter 20 g Glucose, 1 g FOA, 50 mg Uracil, 200 ml Citrat-Puffer (0,5 M, pH 
4,5) und 40 ml SpurensalzlSsung nach Sutter, 1975, PNAS, 72:127). Ho- 
monukleate pyrG"-Mutanten zeigten Wachstum auf dem Uracil-haltigen 
FOA-Medium; aber kein Wachstum bei Plattierung auf FOA-Medium ohne 
Uracil. Auf die gleiche Weise wurden aus den im folgenden beschriebenen 

10 GVO von Blakeslea trispora zur Herstellung von Xanthophyllen homo- 
nukleate GVO hergestellt. 

Alternativ ist es moglich die Sporen analog zur Vorschrift von Roncero et 
al. auf Medium mit 5-Carbon-5-deazariboflavin zu plattieren, das zusatz- 
15 lich Hygromycin enthSIt (Roncero et al., 1984, Mutation Research, 125: 
195 - 204). Hierdurch werden homokaryonte Zellen des Genotyps hyg R 
und dar" selektiert. Nach diesem Prinzip werden homokaryonte Stamme 
von Blakeslea trispora mit dem Phanotyp hyg R und dar" erzeugt. 

20 

Ausfuhrungsbeispiele zur Herstellung von gentechnisch veranderten 
Organismen von Blakeslea trispora fur die Herstellung von Caroti- 
noiden und Carotinoidvorstufen 

Die Erzeugung der im folgenden genannten Plasmide erfolgte durch die 
25 Methode ..overlap-extension PCR" und durch anschlieliende Insertion der 
Amplifikationsprodukte in das Plasmid pBinAHyg. Die Methode ..overlap- 
extension PCR" erfolgte wie in Innis et al. (Eds.) PCR protocols: a guide to 
methods and applications, Academic Press, San Diego beschrieben. Die 
Transformation der pBinAHyg-Abkommlinge und die Herstellung homo- 
30 nukleater gentechnisch verSnderter Stamme von Blakeslea trispora erfolg- 
te wie oben beschrieben. 
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Gentechnisch veranderte Stamme von Blakeslea trispora zur Herstel- 
lung von Zeaxanthin 

Folgende Plasmide (Abkommlinge von pBinAHyg) wurden zur gentechni- 
5 schen Veranderung von Blakeslea trispora fur die Herstellung von Zea- 
xanthin verwendet, codieren also u.a. Hydroxylasen (crtZ): 

p-tef1 -HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ (SEQ ID 
NO: 70) aus Haematococcus pluvialis Flotow NIES-144 (Accession 
No. AF1 62276) unter Kontrolle des ptefl Promotors aus Blakeslea 
10 trispora (Seq. pBinAHygBTpTEFI -HPcrtZ, SEQ ID NO: 37, Fig. 5); 

p-carRA-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 
Promotors pcarRA aus Blakeslea trispora (Seq. pBinAHyg- 
BTpcarRA-HPcrtZ, SEQ ID NO: 38, Fig. 6) 

15 - p-carB-HPcrtZ, enthaltend Gen der Hydroxylase HPcrtZ aus Hae- 
matococcus pluvialis Flotow NIES-144 unter Kontrolle des Promo- 
tors pcarB aus Blakeslea trispora (Seq. pBinAHygBTpcarB-HPcrtZ, 
SEQ ID NO: 39, Fig. 7) 

p-carRA-HPcrtZ-TAG-3'carA-IR, enthaltend Gen der Hydroxylase 
20 HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter Kon- 

trolle des Promotors pcarRA aus Blakeslea trispora. Stromabwarts 
des Gens der Hydroxylase ist eine Inverted-Repeat-Struktur lokali- 
siert, die aus dem 3'-Ende von carA und der stromabwarts von carA 
gelegenen Region stammt (IR, SEQ ID NO: 74, .Inverted Repeat V 
25 ca. 350 bp von carA, dann ca. 200 bp ,Loop' und anschlieftend ca. 

350 bp Jnverted Repeat 2') (Seq. pBinAHyg-BTpcarRA-HPcrtZ- 
TAG-3'carA-IR, SEQ ID NO: 40, Fig. 8); 

p-carRA-HPcrtZ-GCG-3'carA-IR, enthaltend Gen der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 unter Kon- 
30 trolle des Promotors pcarRA aus Blakeslea trispora. Das Gen der 
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Hydroxylase ist mit einer Inverted-Repeat-Struktur fusioniert, die 
aus dem 3'-Ende von carA und der stromabwarts von carA gelege- 
nen Region stammt (IR, SEQ ID NO: 74, .Inverted Repeat 1' ca. 
350 bp von carA, dann ca. 200 bp .Loop' und anschliefJend ca. 350 
5 bp .Inverted Repeat 2'). Das abgeleitete Fusionsprotein besteht 

folglich aus der Hydroxylase von Haematococcus pluvialis und dem 
Carboxyterminus von CarA aus Blakeslea trispora (Seq. pBinAHyg- 
BTpcarRA-HPcrtZ-GCG-3'carA-IR, SEQ ID NO: 41, Fig. 9); 

p-tef1-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ (SEQ ID 
10 NO: 71) aus Erwinia uredova 20D3 (Accession No. D90087) unter 

Kontrolle des ptefl Promotors (Seq. pBinAHygBTpTEFI-EUcrtZ, 
SEQ ID NO: 42, Fig. 10); 

p-carRA-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus Erwi- 
nia uredova 20D3 unter Kontrolle des Promotors pcarRA aus Bla- 
15 keslea trispora (Seq. pBinAHygBTpcarRA-EUcrtZ, SEQ ID NO: 43, 

Fig. 11); 

p-carB-EUcrtZ, enthaltend Gen der Hydroxylase EUcrtZ aus Erwi- 
nia uredova 20D3 unter Kontrolle des Promotors pcarB aus Blakes- 
lea trispora (Seq. pBinAHygBTpcarB-EUcrtZ, SEQ ID NO: 44, Fig. 
20 12); 

p-gpdA-HPcrtZ-t-crtZ, enthaltend Gen der Hydroxylase HPcrtZ aus 
Haematococcus pluvialis Flotow NIES-144 unter Kontrolle des 
gpdA Promotors und des Terminators t-crtZ; d.h. des stromabwarts 
von crtZ aus Haematococcus pluvialis Flotow NIES-144 gelegenen 
25 Sequenzabschnitts (SEQ ID NO: 73) (Seq. pBinAHyg-gpdA-HPcrtZ- 

tcrtZ, SEQ ID NO: 45, Fig. 13). 

p-gpdA-BTcarR-HPcrtZ-BTcarA, enthaltend Genfusion aus Genen 
der Lycopincyclase carR aus Blakeslea trispora, der Hydroxylase 
HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 und der 
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Phytoensynthase carA aus Blakeslea trispora unter Kontrolle des 
gpdA Promotors aus Aspergillus nidulans (Seq. pBinAHyg- 
carR_crtZ_carA, SEQ ID NO: 46, Fig. 14); 

5 Herstellung gentechnisch veranderter Stamme von Blakeslea trispo- 
ra zur Herstellung von Canthaxanthin 

Folgende Plasmide (Abkornmiinge von pBinAHyg) wurden zur gentechni- 
schen Veranderung von Blakeslea trispora fur die Herstellung von 
Canthaxanthin verwendet, codieren also u.a. Ketolasen (crtW): 
10 - p-tef1-NPcrtW, enthaltend das Gen der Ketolase NPcrtW (SEQ ID 
NO: 72) aus Nostoc punctiforme PCC73102 (ORF148, Accesion 
No. NZ_AABC01000196) unter Kontrolle des ptefl Promotors aus 
Blakeslea trispora (Seq. pBinAHygBTpTEFI-NpucrtW, SEQ ID NO: 
47, Fig. 15); 

15 - p-carRA-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus 
Nostoc punctiforme PCC73102 unter der Kontrolle des Promotors 
pcarRA aus Blakeslea trispora (Seq. pBinAHygBTpcarRA-NpucrtW, 
SEQ ID NO: 48, Fig. 16); 

p-carB-NPcrtW, enthaltend das Gen der Ketolase NPcrtW aus No- 
20 stoc punctiforme PCC73102 unter der Kontrolle des Promotors 

pcarB aus Blakeslea trispora (Seq. pBinAHygBTpcarB-NpucrtW, 
SEQ ID NO: 49, Fig. 17); 

Herstellung gentechnisch veranderter Stamme von Blakeslea trispo- 
25 ra zur Herstellung von Astaxanthin 

Folgende Plasmide (Abkornmiinge von pBinAHyg) wurden zur gentechni- 
schen Veranderung von Blakeslea trispora fur die Herstellung von Asta- 
xanthin verwendet, codieren also u.a. fUr Hydroxylasen (crtZ) und Ketola- 
sen (crtW): 
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p-carRA-HPcrtZ-pcarRA-NPcrtW, enthaltend das Gen der Hydroxy- 
lase HPcrtZ aus Haematococcus pluvialis Flotow NIES-144 und das 
Gen der Ketolase NPcrtW aus Nostoc punctiforme PCC73102 
(ORF148, Accesion No. NZ_AABC01000196) beide jeweils unter 
5 Kontrolle des Promotors pcarRA aus Blakeslea trispora (Seq. pBi- 

nAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW, SEQ ID NO: 50, Fig. 
18); 

p-carRA-EUcrtZ-pcarRA-NPcrtW, enthaltend das Gen der Hydroxy- 
lase EUcrtZ aus Erwinia uredova20D3 (Accession No. D90087) und 
10 das Gen der Ketolase NPcrtW aus Nostoc punctiforme PCC73102 

beide jeweils unter Kontrolle des Promotors pcarRA aus Blakeslea 
trispora (Seq. pBinAHygBTpcarRA-EUcrtZ-BTpcarRA-NpucrtW, 
SEQ ID NO: 51, Fig. 19); 



15 Klonierung und Sequenzanalyse von Genen und Promotoren, die 

beispielhaft fur die gentechnische Veranderung von Blakeslea trispo- 
ra genutzt werden konnen. 

Nachfolgend werden beispielhaft die Klonierung und Sequenzierung ver- 
schiedener Gene und Promotoren aus Blakeslea trispora beschrieben. 

20 

Klonierung und Sequenzanalyse ptefl 

Die Klonierung von p-tef aus Blakeslea trispora erfolgte auf der Grundlage 
einer bereits in GenBank veroffentlichten Sequenz des Strukturgens fur 
den Translations-Elongationsfaktor 1-a aus Blakeslea trispora 

25 (AF1 57235). Ausgehend von dem Sequenzeintrag AF1 57235 wurden 
Primer fur die inverse PCR ausgewaM, urn die stromaufwarts des Struk- 
turgens gelegene Promotoregion zu amplifizieren und zu sequenzieren. 
In der inversen nested PCR an 200 ng Xhol-gespaltener und zirkularisier- 
ter genomischer DNA von Blakeslea trispora ATCC14272 wurde ein 3000- 

30 bp-Fragment in folgendem Ansatz erhalten: Matrizen-DNA (1 ug genomi- 



WO 2004/063359 



75 



PCT/EP2004/000099 



sche DNA von Blakeslea trispora ATCC 14272) Primer MAT344 5'- 
GGCGTACTTGAAGGAACCCTTACCG-3' (SEQ ID NO: 63) und MAT 345 
5'-ATTGATGCTCCCGGTCACCGTGATT-3' (SEQ ID NO: 64) je 0,25 pM, 
100 pM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U Herculase (Zu- 
5 gabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zy- 
klus); 85 °C, 5 min (1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 °C, 30 s (30 
Zyklen); 72 °C, 10 min (1 Zyklus). Der Sequenzabschnitt, der stromauf- 
warts des vermutlichen Startcodons des Gens tefl innerhalb 3000-bp- 
Fragmentes liegt, wurde als Promotor ptef 1 bezeichnet. 

10 

Klonierung Sequenzanalyse des Gens der HMG-CoA-Reduktase aus 
Blakeslea trispora 

Zunachst wurde mit dem Cosmidvektor pANsCosI eine Genbank von Bla- 
keslea trispora ATCC 14272, Mating Type (-) hergestellt. Der Vektor wur- 

15 de durch Spaltung mit Xbal linearisiert und anschlieliend dephosphoryliert. 
Eine weitere Spaltung mit mit BamHI schuf die Insertionsstelle, in welche 
die mit Sau3AI partiell gespaltene und dephosphorylierte genomische 
DNA von Blakeslea trispora ligiert wurde. Die derart gebildeten Cosmide 
wurden anschlieRend in vitro verpackt und in Escherichia coli ubertragen. 

20 Auf der Grundlage der bekannten Sequenz eines Fragmentes des HMG- 
CoA-Reduktase codierenden Gens aus Blakeslea trispora (Eur. J. Bio- 
chem 220, 403-408 (1994)) wurde eine 315-bp-DNA-Sonde durch folgen- 
de PCR hergestellt. Reaktionsansatz: 1 pg genomische DNA von Blakes- 
lea trispora ATCC . 14272, Primer MAT314 5- 

25 CCGATGGCGACGACGGAAGGTTGTT-3' [SEQ ID NO 79] und MAT315 
5'-CATGTTCATGCCCATTGCATCACCT-3' [SEQ ID NO 80] je 0,25 pM, 
100 pM dNTP, 10 pi Herculase-Polymerasepuffer 10x, 5 U Herculase (Zu- 
gabe bei 85 °C), H 2 0 ad 100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zy- 
klus); 85 °C, 5 min (1 Zyklus); 58 °C, 30 s. 72 °C, 30 s, 95 °C, 30 s (30 

30 Zyklen); 72 °C, 10 min (1 Zyklus). 
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Mit dieser DNA-Sonde wurde die Cosmid-Genbank durchmustert. Es wur- 
de ein Klon identifiziert, dessen Cosmid mit der DNA-Sonde hybridisierte. 
Die Insertion dieses Cosmids wurde sequenziert. Die DNA-Sequenz ent- 
hielt einen Abschnitt, der dem Gen einer HMG-CoA-Reduktase zugeord- 
5 net wurde [HMG-CoA-Red.gb]. 

Klonierung und Sequenzanalyse carB 

(carB = Gen der Phytoendesaturase aus Blakeslea trispora) 

Aus dem Sequenzvergleich der Peptidsequenzen von Phytoendesatura- 

10 sen und dem Vergleich der zugehorigen DNA-Sequenzen von Phycomy- 
ces blakesleeanus, Cercospora nicotianae, Phaffia rhodozyma und Neu- 
rospora crassa wurden die degenerierten Primer MAT182 5'- 
GCNGARGGNATHTGGTA-3' (SEQ ID 52) und MAT192 5'- 
TCNGC NAG RAADATRTTRTG-3 (SEQ ID 53) abgeleitet. Die PCR wurde 

15 in 100 pi Ansatzen durchgefQhrt. Diese enthielten 200 ng genomische 
DNA von Blakeslea trispora ATCC14272, 1 uM MAT182, 1 uM MAT192, 
100 uM dNTP, 10 pi Pfu-Polymerasepuffer 10x, 2,5 U Pfu-Polymerase 
(Zugabe bei 85 °C), H 2 0 ad 100 pi. 

20 Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min (1 Zyklus); 40 
°C, 30 s, 72 °C, 30 s, 95 6 C, 30 s (35 Zyklen); 72 °C, 10 min (1 Zyklus). 

Hiermit wurde ein 358-bp-Fragment erhalten, dessen abgeleitete Peptid- 
sequenz Ahnlichkeit zu den Sequenzen der Phytoendesaturasen aufwies. 

25 Durch die Methode der inversen PCR (Innis et al. in PCR protocols: a 
guide to methods and applications. 1990. S. 219-227) wurden nach dem 
Prinzip des Chromosome-Walking die Genregionen stromaufwarts und 
stromabw§rts des 350-bp-Fragmentes folgendermalien amplifiziert, klo- 
niert und sequenziert: 

30 (i) ein 1,1-kbp-Fragment durch PCR mit den Primern MAT219 5'- 
AAGTGACACCGGTTACACGCTTGTCTT-3' (SEQ ID 54) und MAT 
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220 5'-GCTTATCACCATCTGTTACCTCCTTGC-3' (SEQ ID 55) er- 
halten aus 200 ng EcoRI-gespaltener und zirkularisierter genomi- 
scher DNA von Blakeslea trispora ATCC14272, 0,25 pM MAT219, 
0,25 pM MAT220, 100 pM dNTP, 10 pi Herculase- 
5 Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 

100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 
(1 Zyklus); 60 °C, 30 s. 72 °C, 60 s, 95 6 C, 30 s (30 Zyklen); 72 °C, 
10 min (1 Zyklus), 

(ii) ein 2,9-kbp-Fragment durch PCR mit den Primern MAT219 und 
10 MAT220 erhalten aus 200 ng Xbal-gespaltener und zirkularisierter 

genomischer DNA von Blakeslea trispora ATCC14272, 0,25 pM 
MAT219, 0,25 pM MAT220, 100 pM dNTP, 10 pi Herculase- 
Polymerasepuffer 10x, 5 U Herculase (Zugabe bei 85 °C), H 2 0 ad 
100 pi. Das PCR-Profil war 95 °C, 10 min (1 Zyklus); 85 °C, 5 min 
15 (1 Zyklus); 60 °C, 30 s, 72 °C, 3 min, 95 °C, 30 s (30 Zyklen); 72 °C, 

10 min (1 Zyklus); 

Der klonierte Sequenzabschnitt ist schematisch in Fig. 20 (SEQ ID NO 77) 
dargestellt. Die Sequenzierung erfolgte in Strang- und Gegenstrangrich- 
tung mit den klonierten Fragmenten sowie mit den PCR-Produkten. Die 
20 Sequenz des klonierten Sequenzabschnitts ist in Fig. 21 (SEQ ID NO 78) 
gezeigt. 



Sequenzvergleiche 

Die Nukleotidsequenz von carB und die Peptidsequenz des abgeleiteten 
25 Proteins CarB wurden mit den bekannten Sequenzen verwandter Proteine 
verglichen. Zum Sequenzvergleich wurden die Programme GAP und 
BESTFIT eingesetzt. 



30 CarB - Identische Aminoacylreste nach GAP 

Programmeinstellungen: 
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Gap Weight: 8 

Length Weight: 2 

Average Match: 2.912 

Average Mismatch: -2.003 
5 Dabei wurde folgende Werte fur die Gbereinstimmung der Aminosauren zu 

CarB aus Blakeslea trispora ATCC14272 in % gefunden: 

Phycomyces blakesleeanus: 72,491 

Phaffia rhodozyma: 50,460 

Neurospora crassa: 47,943 
10 Cercospora nicotianae: 47,740 

CarB -Identische Aminoacylreste nach BESTFIT 

Programmeinstellungen: 
Gap Weight: 8 
15 Length Weight: 2 
Average Match: 2.912 
Average Mismatch: -2.003 

Dabei wurde folgende Werte fur die Obereinstimmung der Aminosauren zu 
CarB aus Blakeslea trispora ATCC14272 in % gefunden: 
20 Phycomyces blakesleeanus: 73,380 
Phaffia rhodozyma: 53,175 
Neurospora crassa: 51,896 
Cercospora nicotianae: 50,791 

25 carB - Identische Basen nach GAP 

Programmeinstellungen: 
Gap Weight: 50 
Length Weight: 3 
Average Match: 10.000 
30 Average Mismatch: 0.000 
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Dabei wurde folgende Werte fur die Obereinstimmung der Basen zu CarB 
aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 64,853 
Cercospora nicotianae: 50,143 
5 Phaffia rhodozyma: 43,179 
Neurospora crassa: 42,130 

carB -Identische Basen nach BESTFIT 

Programmeinstellungen: 
10 Gap Weight: 50 
Length Weight: 3 
Average Match: 10.000 
Average Mismatch: -9.000 

Dabei wurde folgende Werte fur die Obereinstimmung der Basen zu CarB 
15 aus Blakeslea trispora ATCC14272 in % gefunden: 
Phycomyces blakesleeanus: 68,926 
Phaffia rhodozyma: 62,403 
Neurospora crassa: 60,230 
Cercospora nicotianae: 56,884 

20 

Klonierung zur Expression von carB 

Zur Klonierung und Expression von carB aus Blakeslea trispora wurden 
von dem oben beschriebenen klonierten Sequenzabschnitt aus Blakeslea 
trispora in sechs Leserastern die moglichen Proteinsequenzen abgeleitet. 

25 Diese Proteinsequenzen wurden mit den Sequenzen der Phytoendesatu- 
rasen aus Phycomyces blakesleeanus, Phaffia rhodozyma, Neurospora 
crassa, Cercospora nicotianae verglichen. Auf der Grundlage des Se- 
quenzvergleiches wurden im klonierten Sequenzabschnitt der genomi- 
schen DNA von Blakeslea trispora drei Exons identifiziert, die zusammen- 

30 gefugt eine codierende Region ergeben, deren abgeleitetes Genprodukt 
uber die gesamte Lange 72,7% identische Aminoacylreste mit der Phy- 
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toendesaturase CarB aus Phycomyces blakesieeanus aufweist Dieser 
Sequenzabschnitt aus drei moglichen Exons und zwei mSglichen Introns 
wurde daher als Gen carB bezeichnet. Zur Oberprufung der vorhergesag- 
ten Genstruktur wurde die codierende Sequenz von carB aus Blakeslea 

5 trispora durch PCR mit cDNA von Blakeslea trispora als Matrize und mit 
den Primern Bol1425 5'- 

AGAGAGGGATCCTTAAATGCGAATATCGTTGC-3' (SEQ ID 56) und 
Bol1426 5'-AGAGAGGGATCCATGTCTGATCAAAAGAAGCA-3' (SEQ ID 
57) erzeugt. Das erhaltene DNA-Fragment wurde sequenziert. Die Lokali- 

10 sation von Exons und Introns wurde durch Vergleich der cDNA mit der 
genomischen DNA von carB bestatigt. In Fig. 21 ist die codierende Se- 
quenz von carB schematisch dargestellt. Zur Expression von carB in 
Escherichia coli wurde zunachst die Ndel-Schnittstelle in carB durch die 
Methode overlap extension PCR entfernt sowie am 5-Ende des Gens eine 

15 Ndel-Schnittstelle und am 3-Ende eine BamHI-Schnittstelle eingefugt. 
Das erhaltene DNA-Fragment wurde mit dem Vektor pJOE2702 ligiert. 
Das erhaltene Plasmid wurde als pBT4 bezeichnet und zusammen mit 
pCAR-AE in Escherichia coli XL1-Blue kloniert. Die Expression erfolgte 
durch Induktion mit Rhamnose. Der Nachweis der EnzymaktivitSt erfolgte 

20 durch Nachweis der Lycopinsynthese via HPLC. Die Klonierungsschritte 
sind im folgenden beschrieben: 

PCR 1.1: 

Ca. 0,5 ug cDNA von Blakeslea trispora, 0,25 uM MAT350 5'- 
25 ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3' (SEQ ID 58), 
0,25 uM MAT244 5'- 

GTTCCAATTGGCCACATGAAGAGTAAGACAGGAAACAG-3' (SEQ ID 
59), 100 uM dNTP, 10 pi Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100pL 
30 Temperaturprofil: 
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1 . 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
°C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 8 C 30 s, 9. 72 °C 10min 
Zyklen: (1-2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

5 PCR1.2: 

Ca. 0,5 cDNA von Blakeslea trispora, 0,25 pM MAT243 5'- 
CCTGTCTTACTCTTCATGTGGCCAATTGGAACCAACAC-3' (SEQ ID 
60), 0,25 pM MAT353 5'- 

CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3' (SEQ ID 61), 
10 100 pM dNTP, 10 pi Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu-Polymerase 
(Zugabe bei 85 °C, "hot start") und H 2 0 ad 100 pL. 
Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 40 °C 30s, 4. 72 °C 1 min 30 s, 5. 95 
°C 30 s, 6. 50 °C 30 s, 7. 72 °C 1 min 30 s, 8. 95 °C 30s, 9. 72 °C 10min 
15 Zyklen: (1 -2.) 1x, (3-5.) 5x, (6-8.) 25x, (9.) 1x 

Reinigung der PCR-Fragmente aus PCR 1.1, 1.2 

Dazu wurde PCR 2 zur Herstellung der codierenden Sequenz von carB 
aus Blakeslea trispora fur die Klonierung in pJOE2702 durchgefuhrt: 
20 Ca. 50 ng Produkt aus PCR 1.1 und ca. 50 ng Produkt aus PCR1.2 mit 

0. 25 uM MAT350 5'- 
ACTTTATTGGATCCTTAAATGCGAATATCGTTGCTGC-3' (SEQ ID NO 
58), 0,25 pM MAT353 5'- 
CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3" (SEQ ID NO 

25 61), 100 pM dNTP, 10 pL Pfu-Polymerase-Puffer (lOx), 2,5 U Pfu- 
Polymerase (Zugabe bei 85 °C, "hot start") und H 2 0 ad 100 pL. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 59 °C 30 s, 4. 72 °C 2 min, 5. 95 °C 30 
s, 6.72°C 10 min 

30 Zyklen: (1-2.) 1x, (3-5.) 22x, (6.) 1x 
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Anschlieftend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1 ,7 
kbp), eine Ligation in Vektor pPCR-Script-Amp, eine Klonierung in Esche- 
richia coli XL1-Blue, Sequenzierung der Insertion, Spaltung mit Ndel und 
BamHI sowie eine Ligation in pJOE2702. Das erhaltene Plasmid wurde als 
5 pBT4 bezeichnet. 

Charakterisierung und Nachweis der Enzymaktivitat von CarB (Phy- 
toendesaturase) 

Das von carB abgeleitete Genprodukt wurde als CarB bezeichnet. CarB 
10 weist auf Grundlage der Peptidsequenzanalyse folgende Eigenschaften 
auf: 

Lange: 582 Aminoacyireste 

Molekulare Masse: 66470 
Isoelektrische Punkt: 6,7 
15 Katalytische Aktivitat: Phytoendesaturase 

Edukt: Phytoen 
Produkt: Lycopin 
EC-Nummer: EC 1.14.99- 

Der Nachweis der Enzymaktivitat erfolgte in vivo. Wenn das Plasmid 
20 (pCAR-AE) in Escherichia coli XL1-Blue ubertragen wird, entsteht der 
Stamm Escherichia coli XL1-Blue (pCAR-AE). Dieser Stamm synthetisiert 
Phytoen. Wenn zusatzlich das Plasmid pBT4 in Escherichia coli XL1-Blue 
Ubertragen wird, entsteht der Stamm Escherichia coli XL1-Blue (pCAR- 
AE)(pBT4). Da ausgehend von carB eine enzymatisch aktive Phytoende- 
25 saturase gebildet wird, produziert dieser Stamm Lycopin. 

Die Plasmide pCAR-AE und pBT4 wurden daher in Escherichia coli uber- 
tragen. Nach Wachstum in FlUssigkultur wurden die Carotinoide aus den 
Zellen extrahiert und charakterisiert (vgl. oben). 



30 
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Durch HPLC Analyse wurde nachgewiesen, dali der Stamm Escherichia 
coii XL1-Blue (pCAR-AE) Phytoen und der Stamm Escherichia coii XL1- 
Blue (pCAR-AE)(pBT4) Lycopin produziert. CarB weist folglich die Enzym- 
aktivitat einer Phytoendesaturase auf . 

5 

Herstellung gentechnisch veranderter Stamme von Blakeslea trispo- 
ra zur Herstellung von Phytoen 

Nachfolgend werden beispielhaft die Herstellung von gentechnisch veran- 
derten Organismen zur Herstellung von Phytoen beschrieben. 

10 

Vector pBinAHygAcarB zur Erzeugung von carB- -Mutanten von Bla- 
keslea trispora 

Fur die Deletion von carB in Blakeslea trispora wurde der Vektor pBinA- 
HygAcarB (SEQ. ID. NO:62, Fig. 22) konstruiert. Der Vorlaufer von pBi- 
15 nAHygAcarB ist pBinAHyg (SEQ. ID. NO:3, Fig. 2). pBinAHyg wurde fol- 
gendermafien konstruiert: 

Aus dem Plasmid pANsCosI (SEQ. ID. NO:4, Fig. 1, Osiewacz, 1994, 
Curr. Genet. 26:87-90) wurde die gpdA-hph Kassette als Bglll/Hindlll 
Fragment isoliert und in das BamHI/Hindlll geoffnete binare Plasmid 

20 pBin19 (Bevan, 1984, Nucleic Acids Res. 12:8711-8721) ligiert. Der so 
erhaltene Vektor wurde als pBinAHyg bezeichnet und enthalt das E. coii 
Hygromycin-Resistenzgen (hph) unter Kontrolle des gpd Promotors und 
des trpC Terrminators aus Aspergillus nidulans sowie die entsprechenden 
Bordersequenzen, die fur den DNA-Transfer von Agrobacterium notwen- 

25 dig sind. 

Die Amplifikation der codierenden Sequenz von carB mit den Primern 
MAT350 (SEQ ID NO 58) und MAT353 (SEQ ID NO 61) mittels PCR wur- 
de mit den folgenden Parametern durchgefuhrt: 
30 50 . ng pBT4 mit 0,25 pM MAT350 5-ACTTTATTGGATCCTTAAAT- 
GCGAATATCGTTGCTGC-3', 0,25 pM MAT353 5 1 - 
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CTATTTTAATCATATGTCTGATCAAAAGAAGCATATTG-3', 100 pM 
dNTP, 10 pL Pfu-Polymerase-Puffer, 2,5 U Pfu-Polymerase (Zugabe bei 
85 °C, "hot start") und ad 100 pL H 2 0 
Temperaturprofil: 

5 1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 30s, 4. 72°C 2 min, 5. 95 °C 30s, 
6. 72 °C 10 min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

Anschlieliend erfolgte eine Reinigung des erhaltenen Fragmentes (~ 1,7 
10 kbp), eine Spaltung mit Hindlll, eine weitere Reinigung des 364-bp-Hindlll- 
Fragments-carB, gefolgt von einer Spaltung von pBinAHyg mit Hindlll, eine 
Ligation von 364-bp-Hindlll-Fragments-carB in pBinAHyg, eine Transfor- 
mation des Vektors in Escherichia coli und eine Isolierung des Konstruktes 
und Bezeichnung als pBinAHygAcarB wie oben beschrieben. Alternativ 
15 erfolgte eine partielle Spaltung mit Hindlll und die Klonierung eines grQfce- 
ren Hindill-Fragmentes aus carB in pBinAHyg zur Herstellung von pBinA- 
HygAcarB. 

20 Erzeugung von carB" -Mutanten von Blakeslea trispora 

Zunachst wurde das Plasmid pBinAHygAcarB in den Agrobakterienstamm 
LBA 4404 Qbertragen, z. B. durch Elektroporation (vgl. oben). Anschlie- 
liend wurde das Plasmid von Agrobacterium tumefaciens LBA 4404 in 
Blakeslea trispOra ATCC 14272 und in Blakeslea trispora ATCC 14271 
25 Qbertragen (vgl. oben). Der erfolgreicheNachweis des Gentransfers in 
Blakesieslea trispora erfolgte uber Polymerase-Kettenreaktion nach fol- 
gendem Protokoll: 

Ca. 0,5 ug DNA aus Blakeslea trispora ATCC 14272 carB" bzw. ATCC 
14271 carB" wurden mit 0,25 pM Primer hph forward 5'- 
30 CGATGTAGGAGGGCGTGGATA-3' (SEQ ID NO 5), 0,25 pM Primer hph 
reverse S'-GCTTCTGCGGGCGATTTGTGT-S' (SEQ ID NO 6), 100 pM 



WO 2004/063359 



85 



PCT/EP2004/000099 



dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Poiymerase (Zugabe bei 85 °C, "hot start") und ad 100 pi H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95°C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
5 min, 6.72°C10min. 

Zyklen: (1.-2.) 1x, (3-5.) 30x, (6.) 1x 

Als Negativkontrolle wurde eine Amplifikation des Kanamycinresistenz- 
gens aus Agrobacterium versucht. Dazu wurden folgende PCR- 

10 Bedingungen verwendet: 

Ca. 0,5 pg DNA aus Blakesiea trispora ATCC 14272 carB" bzw. ATCC 
14271 carB" wurden mit 0,25 pM Primer nptill forward 5'- 
TGAGAATATCACCGGAATTG-3' (SEQ ID NO 7), 0,25 pM Primer nptill 
reverse 5'-AGCTCGACATACTGTTCTTCC-3' (SEQ ID NO 8), 100 pM 

15 dNTP, 10 pL Herculase-Polymerase-Puffer, 2,5 U Herculase-DNA- 
Polymerase (Zugabe bei 85 °C, "hot start") und ad 100 pL H 2 0 umgesetzt. 
Temperaturprofil: 

1. 95 °C 10 min, 2. 85 °C 5 min, 3. 58 °C 1 min, 4. 72 °C 1 min, 5. 94 °C 1 
min, 6. 72 °C 10 min- 
20 Zyklen: (1-2.) 1x, (3-5.) 30x, (6.) 1x 



C) Produktion von Carotinoiden und Carotinoidvorstufen mit Blakes- 
iea trispora 

25 Zur Produktion der Carotinoide Zeaxanthin, Canthaxanthin, Astaxanthin 
und Phytoen wurden die entsprechenden gentechnisch verSnderten Bla- 
kesiea trispora (+) und (-) Stamme fermentiert, das produzierte Carotinoid 
mittels HPLC Analyse nachgewiesen und isoliert. 
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Das Flussigmedium zur Produktion von Carotinoiden enthielt pro Liter: 19 
g Maismehl, 44 g Sojamehl, 0,55 g KH 2 P0 4 , 0,002 g Thiaminhydochlorid, 
10 % SonnenblumenSI. Der pH wurde mit KOH auf 7,5 eingestellt. 

5 Zur Herstellung der Carotinoiden wurden Schuttelkolben mit Sporensus- 
pensionen von (+) und (-) Stammen der GVO von Blakeslea trispora be- 
impft. Die SchOttelkolben wurden bei 26 °C mit 250 rpm fur 7 Tage inku- 
biert. Alternativ wurde zu Mischungen der Stamme nach 4 Tagen Trispor- 
sauren zugegeben und weitere 3 Tage inkubiert. Die Endkonzentration der 

10 Trisporsauren betrug 300 - 400 ug/ml. 



Extraktion und Analytik 
Extraktion: 

1. Entnahme von 10 ml Kultursuspension 
15 2. Zentrifugation, 10 min, 5.000 x g 

3. Verwerfen des Gberstandes 

4. Resuspendierung des Pellets in 1 ml Tetrahydrofuran (THF) durch 
Vortexen 

5. Zentrifugation, 5 min, 5.000 x g 
20 6. AbnahmederTHF-Phase 

7. Wiederholung der Schritte 4.-6. (2 x) 

8. Vereinigung der THF-Phasen 

9. Zentrifugation der vereinigten THF-Phasen 5 min bei 20.000 x g, 
urn Reste der waftrigen Phase abzutrennen 

25 

Analytik 

Messung von Phytoen mittels HPLC 

Saule: ZORBAX Eclipse XDB-C8, 5 urn, 150*4,6 mm 

30 Temperatur: 40 °C 

Flulirate: 0,5 ml/min 
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lnjektionsvolumen:10 y\ 

Detektion: UV 220 nm 

Stoppzeit: 12 min 

Nachlaufzeit: 0 min 

5 Maximaldruck: 350 bar 

Eluent A: 50 mM NaH 2 P0 4 , pH 2,5 mit Perchlorsaure 

Eluent B: Acetonitril 

Gradient: 





Zeit [min] 


A [%] 


B [%] 


Fluli [ml/min] 


10 


0 


50 


50 


0,5 




12 


50 


50 


0,5 



Als Matrix wurden Extrakte der Fermentationsbruhen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 pm Filter filtriert. Die Proben 
15 wurden kuhl gehalten und vor Licht geschutzt. Zur Kalibrierung wurden 
jeweils 50 - 1000 mg/l eingewogen und in THF gelost. Als Standard wurde 
Phytoen verwendet, welches unter den gegebenen Bedingungen eine Re- 
tentionszeit von 7,7 min. aufweist. 

20 Messung von Lycopin, p-Carotin, Echinenon, Canthaxanthin, Crypto- 
xanthin, Zeaxanthin und Astaxanthin mittels HPLC 



Saule: Nucleosil 100-7 C18, 250*4,0 mm (Macherey & Nagel) 

Temperatur: 25 °C 

Fluftrate: 1,3 ml/min 
25 Injektionsvolumen: 1 0 pi 

Detektion: 450 nm 

Stoppzeit: 1 5min 

Nachlaufzeit: 2 min 

Maximaldruck: 250 bar 

30 Eluent A: 10% Aceton, 90% H 2 0 

Eluent B: Aceton 
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Gradient: 



Zeit [min] A [%] 
0 30 



B [%} 



FluR [ml/min] 



5 



10 



13 



12 



5 



5 



30 



70 



95 



95 



70 



1,3 
1,3 
1,3 
1,3 



Als Matrix wurden Extrakte der Fermentationsbrilhen verwendet. Vor der 
HPLC wurde jede Probe wird durch ein 0,22 urn Filter filtriert. Die Proben 

10 wurden kuhl gehalten und vor Licht geschOtzt. Zur Kalibrierung wurden 
jeweils 10 mg eingewogen und in 100 ml THF gelost. Als Standard wurden 
folgende Carotinoide mit folgenden Retentionszeiten eingesetzt p-Carotin 
(12,5 min), Lycopin (11,7 min), Echinenon (10,9 min), Cryptoxanthin (10,5 
min), Canthaxanthin (8,7 min), Zeaxanthin (7,6 min) und Astaxanthin (6,4 

15 min) [s. Fig. 23]. 

Produktion von Zeaxanthin mit gentechnisch veranderten Stammen 
von Blakesiea trispora 

Nachfolgend wird beispielhaft die Herstellung von Zeaxanthin mit gen- 
20 technisch veranderten Organismen (GVO) von Blakesiea trispora be- 
schrieben. 

Durch Agrobakterium-vermittelte Transformation wurde der Vektor pBinA- 
HygBTpTEF 1 -HPcrtZ in Blakesiea trispora ubertragen (s.o.). Ein Hygro- 
mycin-resistenter Klon wurde isoliert und auf eine Kartoffel-Glucose- 

25 Agarplatte (Merck KGaA, Darmstadt) ubertragen. 

Nach drei Tagen Inkubation bei 26°C wurde ausgehend von dieser Platte 
ein Sporensuspension hergestellt. Ein 250-ml-Erlenmeyerkolben ohne 
Schikanen mit 50 ml Growth-Medium (Maismehl 47 g/l, Sojamehl 23 g/l, 
KH 2 P0 4 0,5 g/l, Thiamin-HCI 2.0 mg/l, pH mit NaOH vor der Sterilisa- 

30 tion auf 6,2-6,7 eingestellt) wurde mit 1 x1 0 5 Sporen beimpft. Diese Vorkul- 
tur inkubierte 48 Stunden bei 26 °C und 250 upm. Fur die Hauptkultur 
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wurde ein 250-ml-Erienmeyerkolben ohne Schikane enthaltend 40 ml Pro- 
duktionsmedium mit 4 ml der Vorkultur beimpft und 8 Tage bei 26 °C und 
150 upm inkubiert. Das Produktionsmedium enthielt Glucose 50 g/l, Ca- 
sein Acid Hydrolisate 2 g/l, Hefeextrakt 1 g/l, L-Asparagin 2 g/l, KH 2 P0 4 
5 1,5 g/l, MgSCv, x'7 H 2 0 0,5 g/l, Thiamin-HCI 5 mg/l, Span20 10 g/l, Tween 
80 1 g/l, Linolsaure 20 g/l, Maisquellwasser 80 g/l. Nach 72 Stunden er- 
folgte die Zugabe von Kerosin in einer Endkonzentration von 40 g/l Kero- 
sin. 

Nach der Ernte der Kulturen werden die verbliebenen ungefahr 35 ml Kul- 
10 tur mit Wasser auf 40 ml aufgefullt. AnschlieHend werden die Zellen im 
Hochdruckhomogenisator, Typ Micron Lab 40, Fa. APV Gaulin, 3 x bei 
1500 bar aufgeschlossen. 

Die Suspension mit den aufgeschlossenen Zellen wurde mit 35 ml THF 
versetzt und 60 min bei RT im Dunkeln bei 250 upm geschuttelt. Danach 
15 wurden 2 g NaCI zugegeben und das Gemisch nochmals geschuttelt. Der 
Extraktionsansatz wurde dann 10 min bei 5000 x g zentrifugiert. Die ge- 
farbte THF-Phase wurde abgenommen, die Zellmasse war vollstandig ent- 
farbt. 

Die THF-Phase wurde am Rotationsverdampfer bei 30 mbar und 30 °C 
20 auf 1 ml eingeengt und danach nochmals in 1 ml THF aufgenommen. 
Nach Zentrifugation 5 min bei 20 000 x g wurde ein Aliquot der oberen 
Phase entnommen und durch HPLC analysiert (Fig. 24, Fig. 23). 

25 D) Aufarbeituna und jspjjerung der Carotinoide bzw. des Nahrunqs- 
mittels 

Die oben unter A) angegebenen Kulturbruhen wurden wie nachfolgend 
aufgearbeitet, urn hochreine Carotinoide und ein entsprechendes Nah- 
30 rungsmittel zu erhalten. 
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Der Carotinoidgehalt der Kulturbruhen 1, 2, 3 betrug zwischen 0,5 und 1,5 
g/L. 

D1) Beispiel gemafi Varainte a) HA und Variante b) HA bzw. II B 

5 Die Kulturen mit identischen Medien (insgesamt ca. 1 L) wurden am Ende 
des Kultivierungszeitraums vereinigt und mit Hilfe eines DispergiergerSts 
(Ultra.Turrax ®) homogenisiert. 

Die Feststoffkonzentration in den Medien 1 und 2 betrug 37 g/l bzw. 11 
10 g/L. Die Entwasserung der Kulturbruhe erfolgte durch eine Zentrifuge. Bei 
hohen Zellkonzentrationen bzw. hohem Feststoffgehalt des Mediums kann 
dieKulturbrflhe auch ohne vorherige fest-flussig-Trennung weiterverarbei- 
tet werden (Medium 3: 127 g Feststoff/L Nach vorheriger Homogenisation 
mit einem Dispergiergerat (Ultra-Turrax ®) und unter standigem Ruhren 
15 der Suspension wurde die Zellmasse uber eine Schlauchpumpe auf den 
Trockner aufgegeben. Die Eindusung in den Zylinder des Laborspruh- 
trockners erfolgte dabei uber eine Zweistoffduse mit dem Durchmesser 2,0 
mm. Eingedust wurde mit 2 bar und 4,5 Nm 3 /h Stickstoff. Die Temperatur 
am Eintritt betrug ca. 125°C bis 127°C. Das Trocknungsgas war Stickstoff 
20 mit einer Flussrate von 22 Nm 3 /h. Die Austrittstemperatur betrug zwischen 
59°C und 61 °C. Bei jeder der drei Fermentationsbruhen konnte am Zyklon 
des Sprtihtrockners rieselfahiges Produkt abgeschieden werden. Die 
WandbelSge im Turm (sofern vorhanden) platzten automatisch von der 
Gefafcwand ab und werden als unproblematisch eingestuft. 

25 

Es wurden zwischen 8 und 100 g pulvriges Nahrungsmittel erhalten, wel- 
ches direkt als Tierfuttermittel verwendet werden konnte. Es enthielt ca. 1- 
1 0 % Carotinoide bezogen auf das Trockengewicht. Die Restfeuchte be- 
trug weniger als 5%. 

30 
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Beispiel aemaR Variante b) IIC 

D2) Extraktion mit Tetrahydrofuran 

Die Zellen aus je 40 ml der Kulturbriihen 1, 2, 3 wurden 3 x bei 1500 bar 
5 durch einen Hochdruckhomogenisator, Typ Micron Lab 40, Fa. APV Gau- 
lin aufgeschlossen. Je 20 ml der Suspensionen mit den aufgeschlossenen 
Zellen wurden mit 20 ml Tetrahydrofuran versetzt und 30 min, bei 30°C im 
RundschUttler bei 200 Upm geschiittelt. Danach wurden 2 g NaCI zuge- 
setzt und zur Phasentrennung 5 min bei 5000 x g zentrifugiert. Die THF- 
10 Phase wurde abgenommen. Danach wurde die wassrige Phase nochmals 
mit 20 ml THF extrahiert. Die Extrakte wurde vereinigt. Die Carotinoidkon- 
zentration wurde durch HPLC quantifiziert. 

D3) Extraktion mit Methylenchlorid 

15 Die Biomassenabtrennung aus der Kulturbrtihe (200 mL) erfolgte durch 
Zentrifugation bei 5.000 x g fur 10 min. in einer Laborzentrifuge. 

Die abgetrennte Biofeuchtmasse (jeweils ca. 10 g bis 100 g) wurde mit 10 
- 100 mL Wasser vermischt, urn wasserlosliche Komponenten zu entfer- 
20 nen. Die Biomasse wurde abgetrennt (Laborzentrifuge) und danach mit 
Dampf (T = 121, t = 30 min, 1 bar) im Autoklaven sterilisiert und so die 
Zellen aufgeschlossen. 

Zu den Zelltrummern wurden 25 - 250 g Methylenchlorid zugegeben und 
25 das Carotinoid aus der Biomasse mittels Ausschutteln extrahiert. Die Bio- 
masse wurde in einer Laborzentrifuge abgetrennt. 

Es wurde ein Losungsmitteltausch von Methylenchlorid zu Methanol 
durchgefuhrt, wozu die Carotinoidlosung ca. vier Stunden bei 40°C bis 
30 60°C gehalten und uber diesen Zeitraum kontinuierlich mit insgesamt 20 - 
200 mL Methanol versetzt wurde. Methylenchlorid wurde dabei als L6- 
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sungsmittel zuruckgewonnen. Erste Carotinoid Kristalle fielen aus. An- 
schlieliend wurde langsam, tiber 6 h auf ca. 10 °C abgekOhlt, wobei die 
Carotinoid Kristalle an Grolie und Anzahl zunahmen. . Danach wurde die 
Mutterlauge abfiltriert und die Carotinoid Kristalle getrocknet. Ein Teil der 
5 Mutterlauge kann zum Losungsmitteltausch wiederverwendet werden. Der 
andere Teil wird destilliert und das so gereinigte Methanol im LSsungsmit- 
teltausch wiederverwendet. 

Es wurden 0,0,08 g bis 0,24 g Carotinoid Kristalle erhalten, welche eine 
10 Reinheit (HPLC, vgl. oben) von 95 % aufwiesen. Die Ausbeute an Caroti- 
noid Kristallen betrug 80 % bezogen auf die Konzentration an Carotinoid 
in der Biomasse. 

15 Die abgetrennte methylenchloridfeuchte Biomasse wurde nach Wasser- 
dampfdestillation spruhgetrocknet (T E = 125 °C, T A = 60 °C) und kann als 
Tierfuttermitteladditiv eingesetzt werden. 

Hietzu wurde nach vorheriger Homogenisation mit einem Dispergiergerat 
20 (Ultra-Turrax) und unter standigem Riihren der Suspension die Zellmasse 
Qber eine Schlauchpumpe auf den Trockner aufgegeben. 

Die EindOsung in den Zylinder des Laborspruhtrockners erfolgte dabei 
uber eine Zweistoffduse mit dem Durchmesser 2,0 mm. Eingedust wurde 

25 mit 2 bar und 4,5 Nm 3 /h Stickstoff. Die Temperatur am Eintritt betrug ca. 
125°C bis 127°C. Das Trocknungsgas war Stickstoff mit einer Flussrate 
von 22 Nm 3 /h. Die Austrittstemperatur betrug zwischen 59°C und 61 °C. 
Bei jeder der drei Fermentationsbruhen konnte am Zyklon des Spruh- 
trockners rieselfahiges Produkt abgeschieden werden. Die Wandbelage im 

30 Turm (sofern vorhanden) platzten automatisch von der Gefaliwand ab und 
wurden als unproblematisch eingestuft. 
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Es wurden ca. 2,5 - 25 g pulvriges Nahrungsmittel erhalten, welches di- 
rekt als Tierfuttermittel verwendet werden konnte. Es enthielt ca. 0,5% - 
1,5% Carotinoide bezogen auf das Trockengewicht. Die Restfeuchte be- 
5 trug weniger als 5%. 

Insgesamt (einschlielJIich des aufgereinigeten Carotinoid-Nahrungsmittels 
betrug die Ausbeute an Carotinoid ca, 95 % bezogen auf die Ausgangs- 
menge Carotinoid in der Kulturbruhe. 



30 
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Patentanspruche 

1. Verfahren zur Herstellung von Carotinoiden Oder deren Vorstufen mit- 
tels gentechnisch veranderter Organismen der Gattung Blakeslea um- 

5 fassend 

(i) Transformation mindestens einer der Zellen, 

(ii) ggf. Homokaryotisierung der aus (i) erhaltenen Zellen, so dass 
Zellen entstehen, in denen die Kerne in einem oder in mehreren 
genetischen Merkmalen alle gleichartig verandert sind und diese 

10 genetische Veranderung zur Auspragung bringen, und 

(vi) Selektion und Vermehrung der gentechnisch veranderten Zelle 
oder Zellen, 

(vii) Kultivierung der gentechnisch veranderten Zellen, 

(viii) Bereitstellung des von den gentechnisch veranderten Zellen 
75 produzierten Carotinoids oder der von den gentechnischen ver- 
anderten Zellen produzierten Carotinoidvorstufe. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass es sich 
um Zellen von Pilzen der Art Blakeslea trispora handelt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass in 
20 der Transformation (i) ein Vector oder freie Nukleinsauren verwendet 

werden. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector in das Genom mindestens 
einer der Zellen integriert wird. 
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5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector einen Promotor und/oder ei- 
nen Terminator enthalt. 

6. Verfahren nach einem der vorhergehenden Anspruche 3 bis 5, da- 
5 durch gekennzeichnet, dass in der Transformation (i) ein Vector ent- 

haltend den gpd, pcarB, pcarRA und/oder ptef 1 Promotor und/oder den 
trpC Terminator eingesetzt wird. 

7. Verfahren nach einem der vorhergehenden Anspruche 3 bis 6, da- 
10 durch gekennzeichnet, dass in der Transformation (i) ein Vector ent- 

haltend ein Resistenzgen eingesetzt wird. 

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass der in 
der Transformation (i) eingesetzte Vector ein Hygromycin- 
Resistenzgen (hph), insbesondere aus E. coli enthalt. 

15 9. Verfahren nach einem der vorhergehenden Anspruche 5-8, dadurch 
gekennzeichnet, dass der gpd Promotor die Sequenz SEQ ID NO: 1 
aufweist. 

10. Verfahren nach einem der vorhergehenden Anspruche 5-8, dadurch 
gekennzeichnet, dass der trpC Terminator die Sequenz SEQ ID NO: 

20 2 aufweist. 

11. Verfahren nach einem der vorhergehenden Anspruche 5-8, dadurch 
gekennzeichnet, dass der tefl Promotor die Sequenz SEQ ID NO: 35 
aufweist. 

12. Verfahren nach einem der Anspruche 6 bis 11, dadurch gekenn- 
25 zeichnet, dass der gpd Promotor und der trpC Terminator aus Asper- 
gillus nidulans stammen. 
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13. Verfahren nach einem Anspruche 3 bis 12, dadurch gekennzeichnet, 
dass der Vector die SEQ ID NO: 3 umfasst. 

14. Verfahren nach einem der vorhergehenden Anspriiche, dadurch ge- 
kennzeichnet, dass die Transformation (i) mittels Agrobakterien, Kon- 

5 jugation, Chemikalien, Elektroporation, Beschuss mit DNA-beladenen 
Partikeln, Protoplasten oder.Mikroinjektion durchgefuhrt wird. 

15. Verfahren nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, dass in der Homokaryontisierung (ii) ein mutagenes 
Agens eingesetzt wird. 

10 16.Verfahren nach Anspiuch 15, dadurch gekennzeichnet, dass als mu- 
tagenes Agens N-Methyl-N'-nitro-nitrosoguanidin (MNNG), UV- 
Strahlung oder RSntgenstrahlung eingesetzt wird. 

17. Verfahren nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, dass die Selektion durch Markierung und/oder Auswahl 

15 der einkernigen Zellen erfolgt. 

18. Verfahren nach einem der vorhergehenden Anspruche 1 - 17, dadurch 
gekennzeichnet, dass in der Selektion 5-Carbon-5-deazaribofiavin 
(darf) und Hygromycin (hyg) oder 5-Fluororotat (FOA) und Uracil und 
Hygromycin eingesetzt werden. 

20 19.Verfahren nach einem der Anspruche 3 bis 18, dadurch gekenn- 
zeichnet, dass der in der Transformation (i) eingesetzte Vector geneti- 
sche Informationen zur Herstellung von Carotinoiden oder deren Vor- 
stufen enthalt. 

20.Verfahren nach einem der Anspruche 3 bis 19, dadurch gekenn- 
25 zeichnet, dass der in der Transformation (i) eingesetzte Vector geneti- 
sche Informationen zur Herstellung von Carotinen oder Xanthophyllen 
enthalt. 
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21.Verfahren nach einem der Anspruche 3 bis 20, dadurch gekenn- 
zeichnet, dass der in der Transformation (i) eingesetzte Vector geneti- 
sche Informationen zur Herstellung von Astaxanthin, Zeaxanthin, Echi- 
nenon, p-Cryptoxanthin, Andonixanthin, Adonirubin, Canthaxanthin, 
5 3-Hydroxyechinenon, 3-Hydroxyechinenon, Lycopin, (5-Carotin, a- 
Carotin, Lutein, Phytofluen, Bixin oder Phytoen enthalt. 



10 



22.Verfahren zur Bereitstellung mindestens eines hochreinen Carotinoids 
und eines Nahrungsmittels, enthaltend Carotinoide-produzierende Or- 
ganismen und mindestens das eine Carotinoid, umfassend nach der 
15 Kultivierung von Carotinoide-produzierenden Organismen der Gattung 
Blakeslea die Schritte 

I) Abtrennung der Biomasse, 

IA) ggf. Waschen der Biomasse mit einem Carotinoide 
nicht losenden Losungsmittel, insbesondere Wasser, 
20 IB) Sterilisation und Zellaufschlufi der Biomasse, 

IC) ggf. Trocknung und/oder homogene Verteilung und 

II) partielle Extraktion der Carotinoide aus der aufgeschlosse- 
nen Biomasse mittels eines Carotinoide losenden Losungs- 
mittels und Trennung des Losungsmittels von der Biomasse, 

25 HA) 
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1) Entfernung von LSsemittelresten aus der Carotinoid- 
haltigen Biomasse, 

2) ggf. homogene Suspension der Biomasse mit einem 
Biomasse-Feststoffgehalt > 10 

5 3) Trocknung der Biomasse bzw. Suspension zur Her- 

steliung des Nahrungsmittels, 

MB) 

1) Kristallisation der Carotinoide aus dem verwendeten 
Losungsmittel und Isolierung der Carotinoid-Kristalle, 
10 insbesondere durch Filtration. 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, dass das 
mindestens eine Carotinoid aus der Gruppe bestehend aus Carotinen 
und Xanthophyllen ausgewShlt ist. 

24. Verfahren nach Anspruch 22 Oder 23, dadurch gekennzeichnet, dass 
15 das mindestens eine Carotinoid aus der Gruppe bestehend aus Asta- 

xanthin, Zeaxanthin, Echinenon, P-Cryptoxanthin, Andonixanthin, Ado- 
nirubin, Canthaxanthin, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, 
Lycopin, p-Carotin, Lutein, Phytofluen, Bixin und Phytoen ausgewahlt 
ist. 

20 25.Verfahren nach einem der AnsprOche 22 bis 24, dadurch gekenn- 
zeichnet, dass das mindestens eine Carotinoid Astaxanthin, Zea- 
xanthin, Bixin Oder Phytoen ist. 

26. Verfahren nach einem der AnsprDche 22-25, dadurch gekennzeich- 
net, dass die Sterilisation und der ZellaufschluG mittels Wasserdampf 

25 oder Mikrowellenstrahlung durchgefuhrt werden. 

27. Verfahren nach einem der Anspruche 22-26, dadurch gekennzeich- 
net, dass die Extraktion der Carotinoide aus der Biomasse mittels Me- 
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thylenchlorid oder uberkritischem Kohlendioxid oder Tetrahydrofuran 
durchgefuhrt wird. 

28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass die im 

uberkritischen Kohlendioxid gelosten Carotinoide direkt isoliert werden 
5 oder in Methylenchlorid aufgenommen werden. 

29. Verfahren nach einem der Anspruche 22-28, dadurch gekennzeich- 
net, dass die Extraktion der Carotinoide aus der Biomasse ein oder 
ggf. mehrstufig erfolgt. 

30. Verfahren nach einem der Anspruche 22-29, dadurch gekennzeich- 
10 net, dass die Entfernung von Losungsmitteln aus der Biomasse im 

Schritt IA1) mittels Wasserdampf-Destillation . 

31. Verfahren nach einem der AnsprOche 22-30, dadurch gekennzeich- 
net, dass die Trocknung in Schritt IIA3) mittels Spruhtrocknung oder 
Kontakttrocknung durchgefuhrt wird. 

15 32.Verfahren nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, dass die Kristallisation im Schritt IIB1) durch graduellen 
Losungsmittelaustausch gegen ein Carotinoide nicht losendes L6- 
sungsmittel erfolgt. 

33. Verfahren nach Anspruch 32, dadurch gekennzeichnet, dass der 
20 Austausch des verwendeten Losungsmittels gegen Wasser oder einen 

niederen Alkohol, insbesondere Methanol erfolgt. 

34. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass der 

gentechnisch veranderte Organismus der Gattung Blakeslea durch 
Transformation mit einem Vector, der eine Sequenz aus der Gruppe 
25 bestehend aus den SEQ ID NO: 37 - 51 und 62 aufweist, herstellbar 
ist. 
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10 



35.Verfahren zur Herstellung eines Nahrungsmittels enthaltend Organis- 
men der Gattung Blakeslea und mindestens ein Carotinoid, umfassend 
nach der Kultivierung von Carotinoide-produzierenden Organismen der 
Gattung Blakeslea die Schritte 

I) Homogene Suspendierung der Feststoffe der Kulturbruhe 
und 

IIA) bei einem Biomasse-Feststoffgehalt der Kulturbruhe von > 2 
% 

1) ggf. Konzentration der Kulturbruhe auf einen Fest- 
stoffgehalt < 50 % und 

2) Trocknung der Kulturbruhe zur Herstellung des Nah- 
rungsmittels 

oder 



15 



I IB) bei einem Feststoffgehalt von < 2 % der Kulturbruhe, 

1) Konzentration der Kulturbruhe auf einen Feststoffge- 
halt > 2 % und < 50 % und 

2) Trocknung der Suspension zur Herstellung des Nah- 
20 rungsmittels, 

oder 

IIC) unabhangig vom Feststoffgehalt der Kulturbruhe, 
1) Abtrennung der Biomasse, 
25 2) ggf. Waschen der Biomasse mit Carotinoide nicht 16- 

senden Ldsungsmitteln, insbesondere Wasser, 

3) Sterilisation und ZellaufschluB, 

4) ggf. Trocknung und homogene Verteilung, 

5) partielle Extraktion der Carotinoide aus der Biomasse 
30 mittels eines Carotinoide ISsendes Losungsmittels, 
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5a) Abtrennung der Carotinoid-haltigen Biomasse 
vom Carotinoid-haltigen LOsungsmittel, 

5b) Entfernung von Losemittelresten aus der Bio- 
masse und 

5 5c) Trocknung der Biomasse zur Herstellung des 

Nahrungsmittels, 
6) Kristaliisation der Carotinoide aus dem in 5a) verwen- 
deten Lfisungsmittel und Isolierung der Carotinoid- 
Kristalie, insbesondere durch Filtration. 

10 36.Verfahren nach Anspruch 35, dadurch gekennzeichnet, dass das 
mindestens eine Carotinoid aus der Gruppe bestehend aus Carotinen 
und Xanthophyllen ausgewahlt ist. 

37. Verfahren nach Anspruch 35 Oder 36, dadurch gekennzeichnet, dass 
das mindestens eine Carotinoid aus der Gruppe bestehend aus Asta- 

15 xanthin, Zeaxanthin, Echinenon, p-Cryptoxanthin, Andonixanthin, Ado- 
nirubin, Canthaxanthin, 3-Hydroxyechinenon, 3'-Hydroxyechinenon, 
Lycopin, p-Carotin, Lutein, Bixin, Phytoen ausgewahlt ist. 

38. Verfahren nach einem der AnsprOche 35-37, dadurch gekennzeich- 
net, dass das mindestens eine Carotinoid Astaxanthin, Zeaxanthin, Bi- 

20 xin oder Phytoen ist. 

39. Verfahren nach einem der AnsprOche 35-38, dadurch gekennzeich- 
net, dass die Sterilisation und der ZellaufschluB im Schritt 113) mittels 
Wasserdampf oder Mikrowellenstrahlung durchgefuhrt wird. 

40. Verfahren nach einem der AnsprOche 35-39, dadurch gekennzeich- 
25 net, dass die Extraktion der Carotinoide aus der Biomasse im Schritt 

IIC5) mittels Methylenchlorid oder Oberkritischen Kohlendioxid 
durchgefuhrt wird. 
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41. Verfahren nach Anspruch 40, dadurch gekennzeichnet, dass die im 
uberkritischen Kohlendioxid gelosten Carotinoide direkt isoliert werden 
oder in Methylenchlorid aufgenommen werden.. 

42. Verfahren nach einem der Anspriiche 35-41, dadurch gekennzeich- 
5 net, dass die Extraktion der Carotinoide aus der Biomasse ein- oder 

ggf. mehrstufig erfolgt. 

43. Verfahren nach einem der Anspruche 35-42, dadurch gekennzeich- 
net, dass die Entfernung von Losungsmitteln aus der Biomasse im 
Schritt IIC5b) mitteis Wasserdampf-Destillation. 

10 44.Verfahren nach einem der Anspruche 35-43, dadurch gekennzeich- 
net, dass die Trocknung in einem der Schritte IIA1), IIB2) oder IIC5c) 
mitteis SprOhtrocknung oder Kontakt durchgefuhrt wird. 

45. Verfahren nach einem der Anspruche 35-44, dadurch gekennzeich- 
net, dass die Kristallisation im Schritt IIC6) durch graduellen Le- 
ys sungsmittelaustausch gegen ein Carotinoide nicht losendes Losungs- 

mittel erfolgt. 

46. Verfahren nach Anspruch 45, dadurch gekennzeichnet, dass der 
Austausch des verwendeten Losungsmittels gegen Wasser oder einen 
niederen Alkohol, insbesondere Methanol erfolgt. 

20 47.Verfahren nach einem der Anspruche 35-46, dadurch gekennzeich- 
net, dass der gentechnisch veranderte Organismus der Gattung Bla- 
keslea durch Transformation mit einem Vector, der eine Sequenz aus 
der Gruppe bestehend aus den SEQ ID NO: 37 - 51 und 62 aufweist, 
herstellbar ist. 

25 48.Nahrungsmittel, insbesondere Tierfuttermittel herstellbar nach einem 
der Verfahren der Anspruche 1 bis 47. 
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49. NahrungsergSnzungsmittel, insbesondere Tierfuttererganzungsmittel 
herstellbar nach einem der Verfahren der Anspriiche 1 bis 47. 

50. Verfahren nach einem der Anspriiche 1-49 dadurch gekennzeichnet, 
dali Nahrungsmittel und Tierfuttermittel aus einer Fermentation erhalt- 

5 lich sind. 

51. Verfahren nach einem der Anspriiche 1-49 dadurch gekennzeichnet, 
daS Nahrungserganzungsmittel und Tierfuttererg§nzungsmittel aus ei- 
ner Fermentation erhSltlich sind. 

52. Verfahren nach einem der Anspriiche 1-49 dadurch gekennzeichnet, 
10 dad mindestens zwei Produkte aus der Gruppe Nahrungsmittel, Nah- 
rungserganzungsmittel, Tierfuttermittel und Tierfuttererganzungsmittel 
aus einer Fermentation erhaltiich sind. 

53. Verwendung der nach einem der Verfahren der Anspriiche 1 bis 14 
erhaltlichen Carotinoide zur Herstellung von kosmetischen, pharma- 

15 zeutischen, dermatologischen Zubereitungen, Nahrungsmitteln, Nah- 
rungsergSnzungsmitteln, Tierfuttermittel oder Tierfuttererganzungsmit- 
tel. 
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Fig. 1: Vektor pANsCosI 




AM (5012) 
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Fig. 2: Vektor pBinAHyg 



ft>/}[ (15735)' 
EccRI (15719) 



T-DNA left border (1 4989-1 51 36 bp) 
Sfffll (14553) 
Wwl (14507)' 
Mfel (13228) 



Xftol (557) 
/l^)700(570) 

Xto>i(939) 



npttll (11 222-1 201 6 bp) 



SsfXI (11038) 




Aftrfl(fl039) 



gpdA promoter (4-21 63 bp) 
/Ml (1581) 
5^(1807) 

EcoRI (2402) 
\Wcfe1 (2609) 
\ph (2164-3183 bp) 
trpC terminator (3205-3978 bp) 
Willi (3993) 
*/l$p700 (4288) 
>5ps! C5048) 

T-DNA right border (6429-6590 bp) 
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Fig. 3: Gels des Ergebnis einer PCR 

Spur: 

1 2 3 4 5 6 7 8 9 
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Fig. 4: Plasmid pBinAHygBTpyrG-SCO 



BglU (13898). 
T-DNA right border (13728-13889 bp) 
NPT1I (12437-13420 bp) 

Apa\ (12347) 
Asp 700 (11587) 
tfrtdlll(11 
BTpyrG part. (10791-11290 bp) 
Hn dill (10786) 
hph (8957-9976 bp) 




AWel(4282) 



</\fctel<9402) 

Sail (8600) 
AvrU (8374) 



Nul{5561) 
BglU (5607) 
T-DNA left border (6043^190 bp) 
Kpn\ (6789) 
Stm I (6791) 
Xho\ (7350) 
Asp 700 (7363) 
Xho\ (7732) 
gpdA promoter (6797-8783 bp) 



WO 2004/063359 



5/24 



PCT/EP2004/000099 



Fig. 5: Plasmid pBinAHygBTpTEFI-HPcrtZ 



At* l (93) 




Sai(8300) 
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Fig. 6: Plasmid pBinAHyg-BTpcarRA-HPcrtZ 



Attl(93) 




Sail (8600) 
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Fig. 7: Plasmid pBinAHygBTpcarB-HPcrtZ 




&l(8600) 
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Fig. 8: Plasmid p-carRA-HPcrtZ-TAG-3'carA-IR 
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Fig. 9: Plasmid p-carRA-HPcrtZ-GCG-3'carA-IR 



StaH (18447) 
Kpn I (18445) 

T-DNAIeflborder(1769&-17846bp) 
Bgl II (17263) 
Ah; I (17217) 



nplin (13932-14726 bp) 



Asp 700 (570) 

gpdA promoter (4-2163 bp) 
Sa/ 1(1807) 

hph(216«183bp) 



Ssf XI (13748) 




AW I (11749) 



fl#II(9309) / 
T-Dl^rightbonder (9139-9300 bp) 



.... JroCterrrinator (3205-3978 bp) 
OTcarRA promoter (3999-4609 bp) 



HPatZ(46ir*5488bp) 
BsfXI(5210) 



V /\pal(5314) 



R 

Asp 700 (6998) 
\ >pal(7758) 
'^1(784^8831 bp) 
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Fig. 10: Plasmid pBinAHygBTpTEFI-EUcrtZ 




I (8600) 
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Fig- 11: Plasmid pBinAHygBTpcarRA-EUcrtZ 
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Fig. 12: Plasmid pBinAHygBTpcarB-EUcrtZ 



Bg)\[ (14607). 
T-DNA right border (14437-14598 bp) 
NPT1I (13146-14129 bp) 
Apa\ (13056). 
Asp 700 (12296) 
tfndlll (12001), 

crtZ (11402-1 1929 bp) 4 

BstX (11637) 
BT carB promoter (10791-11401 bp) 

Hndlll (107B6) 
hph (8957-9976 bp) 

EcoH\ (9195)' 

Sa/I (8600) 




BsfXJ (2092) 



Ah/ 1 (5561) 
BglU (5607) 
T-DNA left border (6043^190 bp) 
Eco Rl (6773) 
Kpnl (6789) 
Sim I (6791) 
/tep700 (7363) 
gpdA promoter (6797-8783 bp) 
AvrW (8374) 
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Fig. 13: Plasmid p-BinAHyg-gpdA-HPcrtZ 



T-DNA 




nptlll 
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Fig. 14: Plasmid pBinAHyg-carRcrtZcarA 




T-DNA right border 
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Fig. 15: Plasmid pBinAHyg-BTpTEFl-NPcrtW 




I (8600) 



WO 2004/063359 



16/24 



. PCT/EP2004/000099 



Fig. 16: Plasmid pBinAHyg_BTpcarRA_NPcrtW 




Avrti (8374) 
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Fig. 17: Plasmid pBinAHyg-BTpcarB-NPcrtW 



Atofl(93) 




Avr II (8374) 
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Fig. 18: Plasmid pBinAHygBTpcarRA-HPcrtZ-BTpcarRA-NpucrtW 
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Fig. 19: Plasmid pBinAHygBTpcarRA-EUcrtZ-BTpcarRA-NpucrtW 



Abf I (93) 



BglU (15986). 
T-DNA right border (15816-15977 bp) 
NPT1I (14525-15508 bp) 
/lpal(14435). 

Asp 700 (1 

NpucrtW (12617-13378 bp) 
BT carRA promoter (12006-12616 bp) 

crtZ (11402-11929 bp) """ 
BsfXl (11637) 
BT carRA promoter (10791-11401 bp) 




BstX (2092) 



Npu crtW) 



hph (8957-9976 bp) 

Eco Rl (9195) 



Ah/ 1 (5561) 
Bfif/ll (5607) 
T-DNA left border (6043-6190 bp) 
EcoR] (6773) 
Kpn\ (6789) 
Srm I (6791) 
Asp 700 (7363) 
gpdA promoter (6797-8783 bp) 
Aw II (8374) 
$at\ (8600) 
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Fig. 20: carB 



carB Introm (1404-1544 bp) 
£coRI{1260) 
MAT219 carB1 3' EcoRI as1 (100.0%) 
MAT220 carB1 3' EcoRI ss1 (100.0%) 
carB Exon2 (555-1403 bp) j 
carB lntron2 (487-554 bp) 
carB Exon3 (180-486 bp) 




Blakeslea trispora carB . 

2981 bp 
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Fig. 21 : CDS von carB 



Bgm (516] 
Asp700 (4! 




carBExonl (W92bp; 
>tsp7Q0(B4; 



carB Exon2 (593-1439 bp) TO1 1 1 1 (1 502) 

Afcfe! (1 155) carB Exon3 (1440-1749 bp 
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Fig. 22: Vektor pBinAHygAcarB 



SrnA (16101 
Kpn\ (16099; 
T-DNA left border (15353-15500 bp) 
Bg!\\ (14917] 
A/ni (14871) 
Nde\ (13592] 



nptlll (11586-12380 bp] 



BsfXI (11402 j" 




Atofl (9403) 



Xhol(557) 
^700(570) 

Xftol (939) 

gpdA promoter (4-2163 bp) 
AvA\ (1581) 

Se/I<1807) 
V ^/Vcfel(2609) 
. Ml (2164-3183 bp) 

" trpC terminator (3205-3978 bp) 
^Mndlll (3993) 

Delta carB (3992-4361 bp) 
Hind\[\ (4357) 
4sp700(4652) 
^pal (5412) 
T-DNA right border (6793-6954 bp) 
Bg/ll (6963) 
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Fig. 23: HPLC Standard 



.Sequence File ■."C:;\HPGHM\2\SEQUENCE\CAR0TIN. s' 
■Method " . : ■• Si \ HPGHEH\2\HETHODS \ CAROTIN . M • 

liast. changed : ai/:I2^20fl3j . , .* 
Carotin oide Nu cl a'dgjll!. g^fttfgjjj : , ci-8 .-250*4, Omni 



DAD1 A,Slg^0^Re^(131103.1V i ROBE0ie!D) 



; mAU 



•soa- 



•.-V" ;3TO- 



J. 

CD 

3 
I 



.x: . 



■ : s : 



i4C 
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Fig. 24: HPLC 



. Sequence- File : C: \HPCHEM\2\SEQliBNCE\CAROTIN, S 
Method : C:\HPCHEM\2\METH0DS\CAR0TIW.M 

,Last changed .11/18;/2.0Q3 " 

. Carotinbide Nucleosil 100-7u C18 . 250*4 r 0inm 



. DAD1 A, ^g=4Sff20 Ref^off (1B1103.t\PROBE010.D) 
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<110> BASF AG 

<120> Verfahren zur Herstellung von Carotinoiden oder deren Vorstufen 
mittels gentechnisch veranderter Organismen der Gattung 
Blakeslea, mit dem Verfahren hergestellte Carotinoide oder deren 
Vorstufen und deren Verwendung 

<130> BASF/NAE877/03 

<160> 80 

<170> Patentln version 3.2 

<210> 1 

<211> 2160 

<212> DNA 

<213> Artificial 



<220> 

<223> Promotor 
<400> 1 

ctttcgacac tgaaatacgt cgagcctgct ccgcttggaa gcggcgagga gcctcgtcct 60 

gtcacaacta ccaacatgga gtacgataag ggccagttcc gccagctcat taagagccag 120 

ttcatgggcg ttggcatgat ggccgtcatg catctgtact tcaagtacac caacgctctt 180 

ctgatccagt cgatcatccg ctgaaggcgc tttcgaatct ggttaagatc cacgtcttcg 240 

ggaagccagc gactggtgac ctccagcgtc cctttaaggc tgccaacagc tttctcagcc 300 

agggccagcc caagaccgac aaggcctccc tceagaacgc cgagaagaac tggaggggtg 360 

gtgtcaagga ggagtaagct ccttattgaa gtcggaggac ggagcggtgt caagaggata 420 

ttcttcgact ctgtattata gataagatga tgaggaattg gaggtagcat agcttcattt 480 

ggatttgctt tccaggctga gactctagct tggagcatag agggtccttt ggctttcaat 540 



WO 2004/063359 
attctcaagt atctcgagtt tgaacttatt 

ttggaatgaa catgaatctg aggactgcaa 

tgtcgaaggc ttggggcacc tgcgttggtt 

gatagctctg caaagggcgt tgcacaatgc 

aatgttatga tgagcattgt attaaatcag 

cacaaaagtc agacggcgta accaaaagtc 

ggctacggaa gacggagaag ccaccttcag 

gtttgatcga gacctaatac agcccctaca 

aggaagtgga ctcaaatcga cttcagcaac 

tacagaataa gataggtgga gagcttatac 

gaccggtgcc tggatcttcc tatagaatca 

gtgacccaga gggtcatgac ttgagcctaa 

tgtgacgaac tcgtgagctc tgtacagtga 

ggacggacgc agagagaagg gctgagtaat 

tgaggtgcag tggatgatta ttaatccggg 

ggctggtgtg cccctcgttg accaagaatc 

tcgaatcacc ggcagtaagc gaaggagaat 

aatagcatgc cattaaccta ggtacagaag 

acgagatagt accttctccg aagtaggtag 

tggcccatcc ggcatctgta gggcgtccaa 

atgaaaccgg aaaggccgct caggagctgg 
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ccctgtgaac cttttattca ccaatgagca - 600 
tcgccatgag gttttcgaaa tacatccgga ' 660 
gaatttagaa cgtggcacta ttgatcatcc 720 
aagtcaaacg ttgctagcag ttccaggtgg 780 
gagatatagc atgatctcta gttagctcac 840 
acacaacaca agctgtaagg atttcggcac 900 
tggactcgag taccatttaa ttctatttgt 960 

acgaccatca aagtcgtata gctaccagtg 1020 

atctcctgga taaactttaa gcctaaacta 1080 

cgagctccca aatctgtcca gatcatggtt 1140 

tccttattcg ttgacctagc tgattctgga 1200 

aatccgccgc ctccaccatt tgtagaaaaa 1260 

ccggtgactc tttctggcat gcggagagac 1320 

aagccactgg ccagacagct ctggcggctc 1380 

accggccgcc cctccgcccc gaagtggaaa 1440 

tattgcatca tcggagaata tggagcttca 1500 

gtgaagccag gggtgtatag ccgtcggcga 1560 

tccaattgct tccgatctgg taaaagattc 1620 

agcgagtacc cggcgcgtaa gctccctaat 1680 

atatcgtgcc tctcctgctt tgcccggtgt 1740 

ccagcggcgc agaccgggaa cacaagctgg 1800 
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cagtcgaccc atccggtgct ctgcactcga cctgctgagg tccctcagtc cctggtaggc 1860 

agctttgccc cgtctgtccg cccggtgtgt cggcggggtt gacaaggtcg ttgcgtcagt 1920 

ccaacatttg ttgccatatt ttcctgctct ccccaccagc tgctcttttc ttttctcttt 1980 

cttttcccat cttcagtata ttcatcttcc catccaagaa cctttatttc ccctaagtaa 2040 
gtactttgct acatccatac tccatccttc ccatccctta ttcctttgaa cctttcagtt 
cgagctttcc cacttcatcg cagcttgact aacagctacc ccgcttgagc agacatcacc 

<210> 2 

<211> 774 

<212> DNA 

<213> Artificial 

<220> 

<223> Terminator 



<220> 

<221> misc_feature 

<222> (267) . . (267) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (475) . . (475) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (566) . . (566) 

<223> n is a, c, g, or t 

<400> 2 

cgatccactt aacgttactg aaatcatcaa acagcttgac gaatctggat ataagatcgt 



2100 
2160 



tggtgtcgat gtcagctccg gagttgagac aaatggtgtt caggatctcg ataagatacg 



120 
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ttcatttgtc caagcagcaa agagtgcctt ctagtgattt aatagctcca tgtcaacaag 180 

aataaaacgc gttttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg 240 

cattgactgc aacctagtaa cgccttncag gctccggcga agagaagaat agcttagcag 300 

agctattttc attttcggga gacgagatca agcagatcaa cggtcgtcaa gagacctacg 360 

agactgagga atccgctctt ggctccacgc gactatatat ttgtctctaa tt-gtactttg 420 

acatgctcct cttctttact ctgatagctt gactatgaaa attccgtcac cagcncctgg 480 

gttcgcaaag ataattgcat gtttcttcct tgaactctca agcctacagg acacacattc 540 

-atcgtaggta taaacctcga aatcanttcc tactaagatg gtatacaata gtaaccatgc 600 

atggttgcct agtgaatgct ccgtaacacc caatacgccg gccgaaactt ttttacaact 660 

ctcctatgag tcgtttaccc agaatgcaca ggtacacttg tttagaggta atccttcttt 720 

ctagctagaa gtcctcgtgt actgtgtaag cgcccactcc acatctccac tcga 774 



<210> 3 

<211> 15739 

<212> DNA 

<213> Artificial 

<220> 

<223> Vector 



<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 



<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 



WO 2004/063359 
<220> 

<221> misc_feature 
<222> (3770) . . (3770) 
<223> n is a, c, g, or t 

<400> 3 

gatctttcga cactgaaata cgtcgagcct 
cctgtcacaa ctaccaacat ggagtacgat 
cagttcatgg gcgttggcat gatggccgtc 
cttctgatcc agtcgatcat ccgctgaagg 
tcgggaagcc agcgactggt gacctccagc 
gccagggcca gcccaagacc gacaaggcct 
gtggtgtcaa ggaggagtaa gctccttatt 
atattcttcg actctgtatt atagataaga 
tttggatttg ctttccaggc tgagactcta 
aatattctca agtatctcga gtttgaactt 
gcattggaat gaacatgaat ctgaggactg 
ggatgtcgaa ggcttggggc acctgcgttg 
tccgatagct ctgcaaaggg cgttgcacaa 
tggaatgtta tgatgagcat tgtattaaat 
caccacaaaa gtcagacggc gtaaccaaaa 
cacggctacg gaagacggag aagccacctt 
tgtgtttgat cgagacctaa tacagcccct 
gtgaggaagt ggactcaaat cgacttcagc 
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gctccgcttg gaagcggcga ggagcctcgt 60 

aagggccagt tccgccagct cattaagagc 120 

atgcatctgt acttcaagta caccaacgct 180 

cgctttcgaa tctggttaag atccacgtct 240 
gtccctttaa ggctgccaac agctttctca . 300 

ccctccagaa cgccgagaag aactggaggg 360 

gaagtcggag gacggagcgg tgtcaagagg 420 

tgatgaggaa ttggaggtag catagcttca 480 

gcttggagca tagagggtcc tttggctttc 540 

attccctgtg aaccttttat tcaccaatga 600 

caatcgccat gaggttttcg aaatacatcc 660 

gttgaattta gaacgtggca ctattgatca 720 

tgcaagtcaa acgttgctag cagttccagg 780 

caggagatat agcatgatct ctagttagct 840 

gtcacacaac acaagctgta aggatttcgg 900 

cagtggactc gagtaccatt taattctatt 960 

acaacgacca tcaaagtcgt atagctacca 1020 

aacatctcct ggataaactt taagcctaaa 1080 



WO 2004/063359 
ctatacagaa taagataggt ggagagctta 
gttgaccggt gcctggatct tcctatagaa 
ggagtgaccc agagggtcat gacttgagcc 
aaatgtgacg aactcgtgag ctctgtacag 
gacggacgga cgcagagaga agggctgagt 
ctctgaggtg cagtggatga ttattaatcc 
aaaggctggt gtgcccctcg ttgaccaaga 
tcatcgaatc accggcagta agcgaaggag 
cgaaatagca tgccattaac ctaggtacag 
ttcacgagat agtaccttct ccgaagtagg 
aattggccca tccggcatct gtagggcgtc 
tgtatgaaac cggaaaggcc gctcaggagc 
tggcagtcga cccatccggt gctctgcact 
ggcagctttg ccccgtctgt ccgcccggtg 
agtccaacat ttgttgccat attttcctgc 
tttcttttcc catcttcagt atattcatct 
taagtacttt gctacatcca tactccatcc 
gttcgagctt tcccacttca tcgcagcttg 
accatgcctg aactcaccgc gacgtctgtc 
gtctccgacc tgatgcagct ctcggagggc 
ggagggcgtg gatatgtcct gcgggtaaat 
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taccgag.ctc ccaaatctgt ccagatcatg 1140 

tcatccttat tcgttgacct agctgattct 1200 

taaaatccgc cgcctccacc atttgtagaa 1260 

tgaccggtga ctctttctgg catgcggaga 1320 

aataagccac tggccagaca gctctggcgg 1380 

gggaccggcc gcccctccgc cccgaagtgg 1440 

atctattgca tcatcggaga atatggagct 1500 

aatgtgaagc caggggtgta tagccgtcgg 1560 

aagtccaatt gcttccgatc tggtaaaaga 1620 

tagagcgagt acccggcgcg taagctccct 1680 

caaatatcgt gcctctcctg ctttgcccgg 1740 

tggccagcgg cgcagaccgg gaacacaagc 1800 

cgacctgctg aggtccctca gtccctggta 1860 

tgtcggcggg gttgacaagg tcgttgcgtc 1920 

tctccccacc agctgctctt ttcttttctc 1980 

tcccatccaa gaacctttat ttcccctaag 2040 

ttcccatccc ttattccttt gaacctttca 2100 

actaacagct accccgcttg agcagacatc 2160 

gagaagtttc tgatcgaaaa gttcgacagc 2220 

gaagaatctc gtgctttcag cttcgatgta ,2280 

agctgcgccg atggtttcta caaagatcgt 2340 
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tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcg.tccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 



WO 2004/063359 
atatttgtct ctaattgtac tttgacatgc 
gaaaattccg tcaccagcnc ctgggttcgc 
ctcaagccta caggacacac attcatcgta 
gatggtatac aatagtaacc atgcatggtt 
gccggccgaa acttttttac aactctccta 
cttgtttaga ggtaatcctt ctttctagct 
ctccacatct ccactcgacc tgcaggcatg 
ttcctgtgtg aaattgttat ccgctcacaa 
agtgtaaagc ctggggtgcc taatgagtga 
tgcccgcttt ccagtcggga aacctgtcgt 
cggggagagg cggtttgcgt attgggccaa 
ggagggaagg taaatattga cggaaattat 
cttgagccat ttgggaatta gagccagcaa 
ggccggaaac gtcaccaatg aaaccatcga 
caagtttgcc tttagcgtca gactgtagcg 
ccttattagc gtttgccatc ttttcataat 
aaccgcctcc ctcagagccg ccaccctcag 
agccgccacc agaaccacca ccagagccgc 
aacatagatg acaccgcgcg cgataattta 
atcgcgtatt aaatgtataa ttgcgggact 
gtcatgcatt acatgttaat tattacatgc 
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tcctcttctt tactctgata gcttgactat 3660 

aaagataatt gcatgtttct tccttgaact 3720 

ggtataaacc tcgaaatcan ttcctactaa 3780 

gcctagtgaa tgctccgtaa cacccaatac 3 840 

tgagtcgttt acccagaatg cacaggtaca 3900 

agaagtcctc gtgtactgtg taagcgccca 3960 

caagcttggc gtaatcatgg tcatagctgt 4020 

ttccacacaa catacgagcc ggaagcataa 4080 

gctaactcac attaattgcg ttgcgctcac 4140 

gccagctgca ttaatgaatc ggccaacgcg 42 00 

agacaaaagg gcgacattca accgattgag 4260 

tcattaaagg tgaattatca ccgtcaccga 4320 

aatcaccagt agcaccatta ccattagcaa 4380 

tagcagcacc gtaatcagta gcgacagaat 4440 

cgttttcatc ggcattttcg gtcatagccc 4500 

caaaatcacc ggaaccagag ccaccaccgg 4560 

aaccgccacc ctcagagcca ccaccctcag 4620 

cgccagcatt gacaggaggc ccgatctagt 4680 

tcctagtttg cgcgctatat tttgttttct 4740 

ctaatcataa aaacccatct cataaataac 4800 

ttaacgtaat tcaacagaaa ttatatgata 4860 



WO 2004/063359 
atcatcgcaa gaccggcaac aggattcaat 
cgatcgggga tcatccgggt ctgtggcggg 
atatcgcggt gcatctcggt cttgcctggg 
ccgggcccga tcatattgtc gctcaggatc 
gtaatgatat cggcaccttc gaccgcctgt 
agcatgagat ccccgcgctg gaggatcatc 
cccaaccttt catagaaggc ggcggtggaa 
gcttggtcgg tcatttcgaa ccccagagtc 
agaaggcgat gcgctgcgaa tcgggagcgg 
cccattcgcc gccaagctct tcagcaatat 
ggtccgccac acccagccgg ccacagtcga 
tgatattcgg caagcaggca tcgccatggg 
gcgccttgag cctggcgaac agttcggctg 
catcctgatc gacaagaccg gcttccatcc 
cttggtggtc gaatgggcag gtagccggat 
ccatgatgga tactttctcg gcaggagcaa 
cttcgcccaa tagcagccag tcccttcccg 
aaggaacgcc cgtcgtggcc agccacgata 
gggcaccgga caggtcggtc ttgacaaaaa 
acacggcggc atcagagcag ccgattgtct 
ccacccaagc ggccggagaa cctgcgtgca 
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cttaagaaac tttattgcca aatgtttgaa 4920 

aactccacga aaatatccga acgcagcaag 49 80 

cagtcgccgc cgacgccgtt gatgtggacg 5040 

gtggcgttgh gcttgtcggc cgttgctgtc 5100 

tccgcagaga tcccgtgggc gaagaactcc 5160 

cagccggcgt cccggaaaac gattccgaag 5220 

tcgaaatctc gtgatggcag gttgggcgtc 5280 

ccgctcagaa gaactcgtca agaaggcgat 5340 

cgataccgta aagcacgagg aagcggtcag 5400 

cacgggtagc caacgctatg tcctgatagc 5460 

tgaatccaga aaagcggcca ttttccacca 5520 

tcacgacgag atcatcgccg tcgggcatgc 5580 

gcgcgagccc ctgatgctct tcgtccagat 5640 

gagtacgtgc tcgctcgatg cgatgtttcg 5700 

caagcgtatg cagccgccgc attgcatcag 5760 

ggtgagatga caggagatcc tgccccggca 5820 

cttcagtgac aacgtcgagc acagctgcgc 5880 

gccgcgctgc ctcgtcctgc agttcattca 5940 

gaaccgggcg cccctgcgct gacagccgga 6000 

gttgtgccca gtcatagccg aatagcctct 6060 

atccatcttg ttcaatcatg cgaaacgatc 6120 



WO 2004/063359 
cagatccggt gcagattatt tggattgaga 

gggaatttat ggaacgtcag tggagcattt 
accttaggcg acttttgaac gcgcaataat 
actccagaaa cccgcggctg agtggctcct 
taaaacggct tgtcccgcgt catcggcggg 
tcatgatcag attgtcgttt cccgccttca 
ttggcgggta aacctaagag aaaagagcgt 
gtgaaaaggt ttatccgttc gtccatttgt 
tctggcgccg gccagcgaga cgagcaagat 
gcccagcaca ggtgcgcagg caaattgcac 
gtgggcggtg acgtcgttcg agtgaaccag 
aatcaggccg atgccgacag cgtcgagcgc 
gttgggtttc acgtctggcc tccggaccag 
ctttatcact gataagttgg tggacatatt 
acaaagttgc agccgaatac agtgatccgt 
gtagacggtc tgacgacacg caaactggcg 
tactggcact tcaggaacaa gcgggcgctg 
gagaatcata cgcattcggt gccgagagcc 
aatgcccgca gcttcaggca ggcgctgctc 
ggcacgcgac cgggcgcacc gcagatggaa 
gaggcgggtt tttcggccgg ggacgccgtc 



PCT/EP2004/000099 

10/357 

gtgaatatga gactctaatt ggataccgag 6180 

ttgacaagaa atatttgcta gctgatagtg 6240 

ggtttctgac gtatgtgctt agctcattaa 6300 

tcaacgttgc ggttctgtca gttccaaacg 63 60 

ggtcataacg tgactccctt aattctccgc 6420 

gtttaaacta tcagtgtttg acaggatata 6480 

ttattagaat aatcggatat ttaaaagggc 6540 

atgtgcatgc caaccacagg gttccccaga 6600 

tggccgccgc ccgaaacgat ccgacagcgc 6660 

caacgcatac agcgccagca gaatgccata 6720 

atcgcgcagg aggcccggca gcaccggcat 67 80 

gacagtgctc agaattacga tcaggggtat 6840 

cctccgctgg tccgattgaa cgcgcggatt 6900 

atgtttatca gtgataaagt gtcaagcatg 6960 

gccgccctgg acctgttgaa cgaggtcggc 7020 

gaacggttgg gggttcagca gccggcgctt 7080 

ctcgacgcac tggccgaagc catgctggcg 7140 

gacgacgact ggcgctcatt tctgatcggg 7200 

gcctaccgcg atggcgcgcg catccatgcc 7260 

acggccgacg cgcagcttcg cttcctctgc 7320 

aatgcgctga tgacaatcag ctacttcact 7380 



WO 2004/063359 
gttggggccg tgcttgagga gcaggccggc 

gttgaacagg ctccgctctc gccgctgttg 

ggtccggacg cagcgttcga gcagggactc 

aggctcgttg tcaggaacgt tgaaggaccg 

ccggagcgca acccactcac tacagcagag 

accgcgtcag acgcccgtag cagcccgcta 

aagcctcacg gccgcgctcg gcctctctgg 

tcactgactc gctgcgctcg gtcgttcggc 

cggtaatacg gttatccaca gaatcagggg 

gccagcaaaa ggccaggaac cgtaaaaagg 

gcccccctga cgagcatcac aaaaatcgac 

gactataaag ataccaggcg tttccccctg 

ccctgccgct taccggatac ctgtccgcct 

gctgcataac cctgcttcgg ggtcattata 

gcacgatata caggattttg ccaaagggtt 

cgtcagccgg gcaggatagg tgaagtaggc 

gtcccttatt cgcacctggc ggtgctcaac 

accgccggcg taacagatga gggcaagcgg 

ggcagcccac ctatcaaggt gtactgcctt 

gcggcggcgg ccggcatgag cctgtcggcc 

atcacgggcg tcgtggacta tgagcacgtc 
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gacagcgatg ccggcgagcg cggcggcacc 7440 

cgggccgcga tagacgcctt cgacgaagcc 7500 

gcggtgattg tcgatggatt ggcgaaaagg 7560 

agaaagggtg acgattgatc aggaccgctg 7620 

ccatgtagac aacatcccct ccccctttcc 7680 

cgggcttttt catgccctgc cctagcgtcc 7740 

cggccttctg gcgctcttcc gcttcctcgc 7800 

tgcggcgagc ggtatcagct cactcaaagg 7860 

ataacgcagg aaagaacatg tgagcaaaag 7920 . 

ccgcgttgct ggcgtttttc cataggctcc 7980 

gctcaagtca gaggtggcga aacccgacag 8040 

gaagctccct cgtgcgctct cctgttccga 8100 

ttctcccttc gggaagcgtg gcgcttttcc 8160 

gcgatttttt cggtatatcc atcctttttc 8220 

cgtgtagact ttccttggtg tatccaacgg 8280 

ccacccgcga gcgggtgttc cttcttcact 8340 

gggaatcctg ctctgcgagg ctggccggct 8400 

atggctgatg aaaccaagcc aaccaggaag 8460 

ccagacgaac gaagagcgat tgaggaaaag 8520 

tacctgctgg ccgtcggcca gggctacaaa 8580 

cgcgagctgg cccgcatcaa tggcgacctg 8640 



WO 2004/063359 
ggccgcctgg gcggcctgct gaaactctgg 

ggtgatgcca cgatcctcgc cctgctggcg 
aaggtcatga tgggcgtggt ccgcccgagg 
cggccggggg gtgcgcgtga ttgccaagca 
cttcgcggag ctggtgaagt acatcaccga 
cgctcaccgg gctggttgcc ctcgccgctg 
cgccagaaac gccgtcgaag ccgtgtgcga 
tcgcggaaaa cttggccctc actgacagat 
actcacccgg cgcggcgttg acagatgagg 
gctggccagc ctcgcaaatc ggcgaaaacg 
tgtggacaag cctggggata agtgccctgc 
acagatgagg ggcgcgatcc ttgacacttg 
acctattgac atttgagggg ctgtccacag 
gcccgttttt cggccaccgc taacctgtct 
accttgtttt taaccagggc tgcgccctgt 
cccccccttc tcgaaccctc ccggcccgct 
cgcccctcgg ccgcgaacgg cctcacccca 
gccgggatcg gggcagtaac gggatgggcg 
gacgtgccgc aggtgctggc atcgacattc 
ggcctgggtg gcggcctgcc cttcacttcg 
gggccggcaa tttttacctt gggcattctt 
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ctcaccgacg acccgcgcac ggcgcggttc 8700 

aagatcgaag agaagcagga cgagcttggc 8760 

gcagagccat gactttttta gccgctaaaa 8820 

cgtccccatg cgctccatca agaagagcga 8880 

cgagcaaggc aagaccgagc gcctttgcga 8940 

ggctggcggc cgtctatggc cctgcaaacg .9000 

gacaccgcgg ccgccggcgt tgtggatacc 9060 

gaggggcgga cgttgacact tgaggggccg 9120 

ggcaggctcg atttcggccg gcgacgtgga 9180 

cctgatttta cgcgagtttc ccacagatga 9240 

ggtattgaca cttgaggggc gcgactactg 9300 

aggggcagag tgctgacaga tgaggggcgc 9360 

gcagaaaatc cagcatttgc aagggtttcc 9420 

tttaacctgc ttttaaacca atatttataa 9480 

gcgcgtgacc gcgcacgccg aaggggggtg 9540 

aacgcgggcc tcccatcccc ccaggggctg 9600 

aaaatggcag cgctggcagt ccttgccatt 9660 

atcagcccga gcgcgacgcc cggaagcatt 9720 

agcgaccagg tgccgggcag tgagggcggc 9780 

gccgtcgggg cattcacgga cttcatggcg 9840 

ggcatagtgg tcgcgggtgc cgtgctcgtg 9900 
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ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9960 

atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 10020 

accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 10080 

ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 10140 

caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 10200 

catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10260 

tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10320 

tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10380 

tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10440 

agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10500 

tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10560 

acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10620 

gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10680 

cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10740 

tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10800 

tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 10860 

atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10920 

gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10980 

cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 11040 

gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 11100 

aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 11160 



WO 2004/063359 
tgttataatt agcttcttgg ggtatcttta 

aatggctaaa atgagaatat caccggaatt 
aaaagatacg gaaggaatgt ctcctgctaa 
cctatattta aaaatgacgg acagccggta 
aaaggacatg atgctatggc tggaaggaaa 
acggcatgat ggctggagca atctgctcat 
agagtatgaa gatgaacaaa gccctgaaaa 
gctctttcac tccatcgaca tatcggattg 
agccgaattg gattacttac tgaataacga 
agaagacact ccatttaaag atccgcgcga 
cgaagaggaa cttgtctttt cccacggcga 
tggcaaagta agtggcttta ttgatcttgg 
cattgccttc tgcgtccggt cgatcaggga 
attttttgac ttactgggga tcaagcctga 
ggatgaattg ttttagtacc tagatgtggc 
ccgacttctt ccgcatcaag tgttttggct 
gcaaggggtc gctggtattc gtgcagggca 
gccagacggt ctacgggacc gacttcattg 
caccaggcgg gtcaaatcag gaataagggc 
cgcaaggagg gtgaatgaat cggacgtttg 
acgcggggtt ttccgccgag gatgccgaaa 
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aatactgtag aaaagaggaa ggaaataata 11220 

gaaaaaactg atcgaaaaat accgctgcgt 11280 

ggtatataag ctggtgggag aaaatgaaaa 11340 

taaagggacc acctatgatg tggaacggga 11400 

gctgcctgtt ccaaaggtcc tgcactttga 11460 

gagtgaggcc gatggcgtcc tttgctcgga 11520 

gattatcgag ctgtatgcgg agtgcatcag 11580 

tccctatacg aatagcttag acagccgctt 11640 

tctggccgat gtggattgcg aaaactggga 11700 

gctgtatgat tttttaaaga cggaaaagcc 11760 

cctgggagac agcaacatct ttgtgaaaga 11820 

gagaagcggc agggcggaca agtggtatga 11880 

ggatatcggg gaagaacagt atgtcgagct 11940 

ttgggagaaa ataaaatatt atattttact 12000 

gcaacgatgc cggcgacaag caggagcgca 12060 

ctcaggccga ggcccacggc aagtatttgg 12120 

agattcggaa taccaagtac gagaaggacg 12180 

ccgataaggt ggattatctg gacaccaagg 12240 

acattgcccc ggcgtgagtc ggggcaatcc 12300 

accggaaggc atacaggcaa gaactgatcg 12360 

ccatcgcaag ccgcaccgtc atgcgtgcgc 12420 
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cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12480 

gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12540 

cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12600 

gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12660 

aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12720 

ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12780 

gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12840 

tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12900 

acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg 12960 

agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 13020 

ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 13080 

cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 13140 

accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 13200 

ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 132 60 

cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13320 

ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13380 

gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13440 

acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13500 

ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13560 

agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13620 

gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13680 



WO 2004/063359 
cgagatccga ttgtcggccc tgaagaaagc 

cgaggagaaa aagcccatgg aggcgttcgc 
cgcctacatc gacggcgaga tcattgggct 
ggacgctcac aaggcgcatc tgtccggcgt 
ggtcgccggt atgctgctgc gggcgttgcc 
acagattcca acgggaatct ggtggatgcg 
gctattctgg agcttgttgt ttatttcggt 
ggtaggcgct gtgcagccgc tgatggtcgt 
gatacgattg atggcggtcc tgggggctat 
gttgacacca aacgcagcgc tagatcctgt 
ttccatggcg ttcggaaccg tgctgacccg 
ctttaccgcc tggcaactgg cggccggagg 
tgatccgcca atcccgatgc ctacaggaac 
gatcggagcg ggtttaacct acttcctttg 
agttgtttcc ttactgggct ttctcagccc 
tcaggccgac agtcggaact tcgggtcccc 
gggagttgat atcgtcaacg ttcacttcta 
gctttatcca gcgatttcct attatgtcgg 
gttaagcgag aaatgaataa gaaggctgat 
tgatcacagg cagcaacgct ctgtcatcgt 
atccgtgttt caaacccggc agcttagttg 
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tccagagatg ttcgggtccg tttacgagca 13740 

tgaacggttg cgagatgccg tggcattcgg 13 800 

gtcggtcttc aaacaggagg acggccccaa 13860 

tttcgtggag cccgaacagc gaggccgagg 13920 

ggcgggttta ttgctcgtga tgatcgtccg 13980 

catcttcatc ctcggcgcac ttaatatttc 14040 

ctaccgcctg ccgggcgggg tcgcggcgac 14100 

gttcatctct gccgctctgc taggtagccc 14160 

ttgcggaact gcgggcgtgg cgctgttggt 14220 

cggcgtcgca gcgggcctgg cgggggcggt 14280 

caagtggcaa cctcccgtgc ctctgctcac 14340 

acttctgctc gttccagtag ctttagtgtt 14400 

caatgttctc ggcctggcgt ggctcggcct 14460 

gttccggggg atctcgcgac tcgaacctac 14520 

cagatctggg gtcgatcagc cggggatgca 14580 

gacctgtacc attcggtgag caatggatag 14640 

aagaaatagc gccactcagc ttcctcagcg 14700 

catagttctc aagatcgaca gcctgtcacg 14760 

aattcggatc tctgcgaggg agatgatatt 14820 

tacaatcaac atgctaccct ccgcgagatc 14880 

ccgttcttcc gaatagcatc ggtaacatga 14940 
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gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 15000 

ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 15060 

gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 15120 

cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 15180 

cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15240 

aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15300 

aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15360 

acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15420 

aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15480 

ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15540 

aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15600 

tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15660 

ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15720 

ttcgagctcg gtacccggg 15739 

<210> 4 
<211> 11611 
<212> DNA 
<213> Artificial 

<220> 

<223> Vector 



<220> 

<221> misc_feature 

<222> (227) . . (227) 

<223> n is a, c, g, or t 
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<220> 

<221> misc_feature 

<222> (318) . . (318) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222>- (526) . . (526) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (8946) .. (8946) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10028) . . (10028) 

<223> n is a, c, g, or t 

<400> 4 

agcttgcatg cctgcaggtc gagtggagat gtggagtggg cgcttacaca gtacacgagg 60 

acttctagct agaaagaagg attacctcta aacaagtgta cctgtgcatt ctgggtaaac 120 

gactcatagg agagttgtaa aaaagtttcg gccggcgtat tgggtgttac ggagcattca 180 

ctaggcaacc atgcatggtt actattgtat accatcttag taggaantga tttcgaggtt 240 

tatacctacg atgaatgtgt gtcctgtagg cttgagagtt caaggaagaa acatgcaatt 300 

atctttgcga acccaggngc tggtgacgga attttcatag tcaagctatc agagtaaaga 360 

agaggagcat gtcaaagtac aattagagac aaatatatag tcgcgtggag ccaagagcgg 420 

attcctcagt ctcgtaggtc tcttgacgac cgttgatctg cttgatctcg tctcccgaaa 480 

atgaaaatag ctctgctaag ctattcttct cttcgccgga gcctgnaagg cgttactagg 540 



ttgcagtcaa tgcattaatg cattgcagat gagctgtatc tggaagaggt aaacccgaaa 



600 
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acgcgtttta ttcttgttga catggagcta 
tggacaaatg aacgtatctt atcgagatcc 
acatcgacac caacgatctt atatccagat 
ttaagtggat cgatcccgcg gtcggcatct 
ggggcgtcgg tttccactat cggcgagtac 
gcttctgcgg gcgatttgtg tacgcccgac 
gcatcgaccc tgcgcccaag ctgcatcatc 
ttggtcaaga ccaatgcgga gcatatacgc 
atgcctccgc tcgaagtagc gcgtctgctg 
gaagatgttg gcgacctcgt attgggaatc 
cgctgttatg cggccattgt ccgtcaggac 
gtgccggact tcggggcagt cctcggccca 
ggacgcactg acggtgtcgt ccatcacagt 
cgcgcatatg aaatcacgcc atgtagtgta 
gaacccgctc gtctggctaa gatcggccgc 
ctgcagaaca gcgggcagtt cggtttcagg 
gcgggagatg caataggtca ggctctcgct 
cgggagcgcg gccgatgcaa agtgccgata 
gcagctattt acccgcagga catatccacg 
ttcttcgccc tccgagagct gcatcaggtc 
cttctcgaca gacgtcgcgg tgagttcagg 
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ttaaatcact agaaggcact ctttgctgct 660 
tgaacaccat ttgtctcaac tccggagctg 720 
tcgtcaagct gtttgatgat ttcagtaacg 780 
actctattcc tttgccctcg gacgagtgct 840 
ttctacacag ccatcggtcc agacggccgc 900 
agtcccggct ccggatcgga cgattgcgtc 960 

gaaattgccg tcaaccaagc tctgatagag 1020 

ccggagccgc ggcgatcctg caagctccgg 1080 

ctccatacaa gccaaccacg gcctccagaa 1140 

cccgaacatc gcctcgctcc agtcaatgac 1200 

attgttggag ccgaaatccg cgtgcacgag 1260 

aagcatcagc tcatcgagag cctgcgcgac 1320 

ttgccagtga tacacatggg gatcagcaat 1380 

ttgaccgatt ccttgcggtc cgaatgggcc 1440 

agcgatcgca tccatggcct ccgcgaccgg 1500 

caggtcttgc aacgtgacac cctgtgcacg 1560 

gaattcccca atgtcaagca cttccggaat 1620 

aacataacga tctttgtaga aaccatcgg.c 1680 

ccctcctaca tcgaagctga aagcacgaga 1740 

ggagacgctg tcgaactttt cgatcagaaa 1800 

catggtgatg tctgctcaag cggggtagct 1860 
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gttagtcaag cfcgcgatgaa gtgggaaagc 

tgggaaggat ggagtatgga tgtagcaaag 

atgggaagat gaatatactg aagatgggaa 

gggagagcag gaaaatatgg caacaaatgt 

ccgacacacc gggcggacag acggggcaaa 

aggtcgagtg cagagcaccg gatgggtcga 

tggccagctc ctgagcggcc tttccggttt 
tatttggacg ccctacagat gccggatggg 
gctctaccta cttcggagaa ggtactatct 
ggacttctgt acctaggtta atggcatgct 
cacattctcc ttcgcttact gccggtgatt 
atagattctt ggtcaacgag gggcacacca 
ggtcccggat taataatcat ccactgcacc 
cttattactc agcccttctc tctgcgtccg 
cggtcactgt acagagctca cgagttcgtc 
attttaggct caagtcatga ccctctgggt 
ggatgattct ataggaagat ccaggcaccg 
tcggtataag ctctccacct atcttattct 
gatgttgctg aagtcgattt gagtccactt 
cgttgtaggg gctgtattag gtctcgatca 
ccactgaagg tggcttctcc gtcttccgta 
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tcgaactgaa aggttcaaag gaataaggga 1920 

tacttactta ggggaaataa aggttcttgg 1980 

aagaaagaga aaagaaaaga gcagctggtg 2040 

tggactgacg caacgacctt gtcaaccccg 2100 

gctgcctacc agggactgag ggacctcagc 2160 

ctgccagctt gtgttcccgg tctgcgccgc 2220 

catacaccgg gcaaagcagg agaggcacga 2280 

ccaattaggg agcttacgcg ccgggtactc 2340 

cgtgaatctt ttaccagatc ggaagcaatt 2400 

atttcgccga cggctataca cccctggctt 2460 

cgatgaagct ccatattctc cgatgatgca 2520 

gcctttccac ttcggggcgg aggggcggcc 2580 

tcagagccgc cagagctgtc tggccagtgg 2640 

tccgtctctc cgcatgccag aaagagtcac 27 00 

acatttttct acaaatggtg gaggcggcgg 2760 

cactccagaa tcagctaggt caacgaataa 2820 

gtcaaccatg atctggacag atttgggagc 2880 

gtatagttta ggcttaaagt ttatccagga 2940 

cctcactggt agctatacga ctttgatggt 3000 

aacacaaata gaattaaatg gtactcgagt 3060 

gccgtgccga aatccttaca gcttgtgttg 3120 
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tgtgactttt ggttacgccg tctgactttt gtggtgagct aactagagat catgctatat 3180 

ctcctgattt aatacaatgc tcatcataac attccacctg gaactgctag caacgtttga 3240 

cttgcattgt gcaacgccct ttgcagagct atcggatgat caatagtgcc acgttctaaa 3300 

ttcaaccaac gcaggtgccc caagccttcg acatccggat gtatttcgaa aacctcatgg 3360 

cgattgcagt cctcagattc atgttcattc caatgctcat tggtgaataa aaggttcaca 3420 

gggaataagt tcaaactcga gatacttgag aatattgaaa gccaaaggac cctctatgct 3480 

ccaagctaga gtctcagcct ggaaagcaaa tccaaatgaa gctatgctac ctccaattcc 3540 

tcatcatctt atctataata cagagtcgaa gaatatcctc ttgacaccgc tccgtcctcc 3600 

gacttcaata aggagcttac tcctccttga caccacccct ccagttcttc tcggcgttct 3660 

ggagggaggc cttgtcggtc ttgggctggc cctggctgag aaagctgttg gcagccttaa 3720 

agggacgctg gaggtcacca gtcgctggct tcccgaagac gtggatctta accagattcg 3780 

aaagcgcctt cagcggatga tcgactggat cagaagagcg ttggtgtact tgaagtacag 3840 

atgcatgacg gccatcatgc caacgcccat gaactggctc ttaatgagct ggcggaactg 3900 

gcccttatcg tactccatgt tggtagttgt gacaggacga ggctcctcgc cgcttccaag 3960 

cggagcaggc tcgacgtatt tcagtgtcga aagatctgat caagagacag gatgaggatc 4020 

gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4080 

gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 4140 

gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4200 

tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4260 

agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4320 

ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4380 
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tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4440 

acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 4500 

ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4560 

gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4620 

ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4680 

tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4740 

ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4800 

ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4860 

cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4920 

ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 4980 

ttcttcgccc accccgggct cgatcccctc gcgagttggt tcagctgctg cctgaggctg 5040 

gacgacctcg cggagttcta ccggcagtgc aaatccgtcg gcatccagga aaccagcagc 5100 

ggctatccgc gcatccatgc ccccgaactg caggagtggg gaggcacgat ggccgctttg 5160 

gtccggatct ttgtgaagga accttacttc tgtggtgtga cataattgga caaactacct 5220 

acagagattt aaagctctaa ggtaaatata aaatttttaa gtgtataatg tgttaaacta 5280 

ctgattctaa ttgtttgtgt attttagatt ccaacctatg gaactgatga atgggagcag 5340 

tggtggaatg cctttaatga ggaaaacctg ttttgctcag aagaaatgcc atctagtgat 5400 

gatgaggcta ctgctgactc tcaacattct actcctccaa aaaagaagag aaaggtagaa 5460 

gaccccaagg actttccttc agaattgcta agttttttga gtcatgctgt gtttagtaat 5520 

agaactcttg cttgctttgc tatttacacc acaaaggaaa aagctgcact gctatacaag 5580 

aaaattatgg aaaaatattc tgtaaccttt ataagtaggc ataacagtta taatcataac 5640 
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atactgtttt ttcttactcc acacaggcat 
aaattgtgta cctttagctt tttaatttgt 
agtgccttga ctagagatca taatcagcca 
aaaaaacctc ccacacctcc ccctgaacct 
taacttgttt attgcagctt ataatggtta 
aaataaagca tttttttcac tgcattctag 
ttatcatgtc tggatctgac gggtgcgcat 

aggctggcgg ggttgcctta ctggttagca 

aagcgactgc tgctgcaaaa cgtctgcgac 

ccgtgtttcg taaagtctgg aaacgcggaa 

actcgctgcg ctcggtcgtt cggctgcggc 

tacggttatc cacagaatca ggggataacg 

aaaaggccag caaaaggcca ggaaccgtaa 

gctccgcccc cctgacgagc atcacaaaaa 

gacaggacta taaagatacc aggcgtttcc 

tccgaccctg ccgcttaccg gatacctgtc 

ttctcatagc tcacgctgta ggtatctcag 

ctgtgtgcac gaaccccccg ttcagcccga 

tgagtccaac ccggtaagac acgacttatc 
tagcagagcg aggtatgtag gcggtgctac 
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agagtgtctg ctattaataa ctatgctcaa 5700 

aaaggggtta ataaggaata tttgatgtat 57 60 

taccacattt gtagaggttt tacttgcttt 5820 

gaaacataaa atgaatgcaa ttgttgttgt 5880 

caaataaagc aatagcatca caaatttcac 5940 

ttgtggtttg tccaaactca tcaatgtatc 6000 

gatcgtgctc ctgtcgttga ggacccggct 6060 

gaatgaatca ccgatacgcg agcgaacgtg 6120 

ctgagcaaca acatgaatgg tcttcggttt 6180 

gtcagcgctc ttccgcttcc tcgctcactg 6240 

gagcggtatc agctcactca aaggcggtaa 6300 

caggaaagaa catgtgagca aaaggccagc 6360 

aaaggccgcg ttgctggcgt ttttccatag 6420 

tcgacgctca agtcagaggt ggcgaaaccc 6480 

ccctggaagc tccctcgtgc gctctcctgt 6540 

cgcctttctc ccttcgggaa gcgtggcgct 6600 

ttcggtgtag gtcgttcgct ccaagctggg 6660 

ccgctgcgcc ttatccggta actatcgtct 672 0 

gccactggca gcagccactg gtaacaggat 6780 

agagttcttg aagtggtggc ctaactacgg 6840 
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ctacactaga aggacagtat ttggtatctg 

aagagttggt agctcttgat ccggcaaaca 
ttgcaagcag cagattacgc gcagaaaaaa 
tacggggtct gacgctcagt ggaacgaaaa 
atcaaaaagg atcttcacct agatcctttt 
aagtatatat gagtaaactt ggtctgacag 
ctcagcgatc tgtctatttc gttcatccat 
tacgatacgg gagggcttac catctggccc 
ctcaccggct ccagatttat cagcaataaa 
tggtcctgca actttatccg cctccatcca 
aagtagttcg ccagttaata gtttgcgcaa 
gtcacgctcg tcgtttggta tggcttcatt 
tacatgatcc cccatgttgt gcaaaaaagc 
cagaagtaag ttggccgcag tgttatcact 
tactgtcatg ccatccgtaa gatgcttttc 
ctgagaatag tgtatgcggc gaccgagttg 
cgcgccacat agcagaactt taaaagtgct 
actctcaagg atcttaccgc tgttgagatc 
ctgatcttca gcatctttta ctttcaccag 
aaatgccgca aaaaagggaa taagggcgac 
ttttcaatat tattgaagca tttatcaggg 
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cgctctgctg aagccagtta ccttcggaaa 6900 

aaccaccgct ggtagcggtg gtttttttgt 6960 

aggatctcaa gaagatcctt tgatcttttc 7020 

ctcacgttaa gggattttgg tcatgagatt 7080 

aaattaaaaa tgaagtttta aatcaatcta 7140 

ttaccaatgc ttaatcagtg aggcacctat 7200 

agttgcctga ctccccgtcg tgtagataac 7260 

cagtgctgca atgataccgc gagacccacg 7320 

ccagccagcc ggaagggccg agcgcagaag 7380 

gtctattaat tgttgccggg aagctagagt 7440 

cgttgttgcc attgctgcag gcatcgtggt 7500 

cagctccggt tcccaacgat caaggcgagt 7560 

ggttagctcc ttcggtcctc cgatcgttgt 7620 

catggttatg gcagcactgc ataattctct 7680 

tgtgactggt gagtactcaa ccaagtcatt 7740 

ctcttgcccg gcgtcaacac gggataatac 7800 

catcattgga aaacgttctt cggggcgaaa 7860 

cagttcgatg taacccactc gtgcacccaa 7920 

cgtttctggg tgagcaaaaa caggaaggca 7980 

acggaaatgt tgaatactca tactcttcct 8040 

ttattgtctc atgagcggat acatatttga 8100 



WO 2004/063359 
atgtatttag aaaaataaac aaataggggt 
tgacgtctaa gaaaccatta ttatcatgac 
gccctttcgt cttcaagaat tcgcggccgc 
gagtcgtatt atgcggccgc gaattctcat 
tttttgttga cttccattgt tcattccacg 
ccaaaaagct cgctttcagc acctgtcgtt 
aaacattaag ttatgacgaa gaagaacgga 
agcgaaaacc cgcgaggtcg ccgccccgta 
atgataataa ttatcaattg catactatcg 
gaaacattcc atcatgatgg ccgtgcggac 
gtctgctgcc atttgctttg tgacatccag 
gttttcgatc aacgtttcaa tgttggtatc 
actgacggtt accttgttct gcgctggctc 
gatattggtc accggctgag ggttttcgat 
caggcngtcc ttgatgaatg acactccatt 
aatgcgctgg tccagctcgg tcgattgcct 
caaggctcat cgaagcgcaa tattgctgct 
cggcaaattt ctgcccttct gatgtcagaa 
ttgctgtgtg tcggtttcag caaaaccaag 
ggcagatcac cagacagcaa cggccaacgg 
cgccgacaac gtgataattt ttatgaccca 
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tccgcgcaca tttccccgaa aagtgccacc 8160 

attaacctat aaaaataggc gtatcacgag 8220 

aattaaccct cactaaagga tccctatagt 8280 

gtttgaccgc ttatcatcga taagctctgc 8340 

gacaaaaaca gagaaaggaa acgacagagg 8400 

tcctttcttt tcagagggta ttttaaataa 8460 

aacgccttaa accggaaaat tttcataaat 8520 

acaaggcgga tcgccggaaa ggacccgcaa 8580 

acggcactgc tgccagataa caccaccggg 8640 

ataggaagcc agttcatcca tcgctttctt 8700 

cgccgcacat tcagcagcgt ttttcagcgc 8760 

aacaccaggt ttaactttga acttatcggc 8820 

atcacgcagg ataccaaggc tgatgttgta 8880 

tgccgctgcg tggatagcac catttgcgat 8940 

gcgaataagt tcgaaggaga cggtgtcacg 9000 

tttgtgcagc agaggtatca atctcaacgc 9060 

caccaaaacg cgtattgacc aggtgttcaa 9120 

aggcaaagtg attttctttc tggtattcag 9180 

ctcgcgcaat tcggctgtgc agatttagaa 9240 

aaaacagcgc atacagaaca tccgtcgccg 9300 

tgatttattt ccttttagac gtgagcctgt 9360 



WO 2004/063359 
cgcacagcaa agccgccgaa agttcctcga 
gctttttgtt gacttccatt gttcattcca 
ggccaaaaag ctcgctttca gcacctgtcg 
aaaaacatta agttatgacg aagaagaacg 
atagcgaaaa cccgcgaggt cgccgccccg 
aaatgataat aattatcaat tgcatactat 
gggaaacatt ccatcatgat ggccgtgcgg 
ttgtctgctg ccatttgctt tgtgacatcc 
gcgttttcga tcaacgtttc aatgttggta 

gcactgacgg ttaccttgtt ctgcgctggc 
tagatattgg tcaccggctg agggttttcg 
atcaggcngt ccttgatgaa tgacactcca 
cgaatgcgct ggtccagctc ggtcgattgc 
gccaaggctc atcgaagcgc aatattgctg 
aacggcaaat ttctgccctt ctgatgtcag 
agttgctgtg tgtcggtttc agcaaaacca 
aaggcagatc accagacagc aacggccaac 
cgcgccgaca acgtgataat ttttatgacc 
gtcgcacagc aaagccgccg aaagttcctc 
tcagctcctt ccggtgggcg cggggcatga 
ttatcatgca actcgtagga caggtgccgg 
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agctagcttc agacgtgtct agatacgtct 9420 
cggacaaaaa cagagaaagg aaacgacaga 9480 
tttcctttct tttcagaggg tattttaaat 9540 
gaaacgcctt aaaccggaaa attttcataa 9600 
taacaaggcg gatcgccgga aaggacccgc 9660 
cgacggcact gctgccagat aacaccaccg 9720 
acataggaag ccagttcatc catcgctttc 9780 
agcgccgcac attcagcagc gtttttcagc 9840 
tcaacaccag gtttaacttt gaacttatcg 9900 

tcatcacgca ggataccaag gctgatgttg 9960 

attgccgctg cgtggatagc accatttgcg 10020 

ttgcgaataa gttcgaagga gacggtgtca 10080 

cttttgtgca gcagaggtat caatctcaac 10140 

ctcaccaaaa cgcgtattga ccaggtgttc 10200 

aaaggcaaag tgattttctt tctggtattc 102 60 

agctcgcgca attcggctgt gcagatttag 10320 

ggaaaacagc gcatacagaa catccgtcgc 10380 

catgatttat ttccttttag acgtgagcct 10440 

gaccgatgcc cttgagagcc ttcaacccag 10500 

ctatcgtcgc cgcacttatg actgtcttct 10560 

cagcgctctg ggtcattttc ggcgaggacc 10620 
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gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 10680 

ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag aagcaggcca 10740 

ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 10800 

gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 10860 

tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 10920 

tcgcggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 10980 

ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc ctataccttg 11040 

tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tgaatggaag 11100 

ccggcggcac ctcgctaacg gattcaccac tccaagaatt ggagccaatc aattcttgcg 11160 

gagaactgtg aatgcgcaaa ccaacccttg gcagaacata tccatcgcgt ccgccatctc 11220 

cagcagccgc acgcggcgca tctcgggcag cgttgggtcc tgcagatccg gctgtggaat 11280 

gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 11340 

atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 11400 

agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 11460 

atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 11520 

tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga 11580 

ggcttttttg gaggcctagg cttttgcaaa a 11611 

<210> 5 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 
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<223> Primer 



<400> 5 



cgatgtagga gggcgtggat a 



21 



<210> 6 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 6 

gcttctgcgg gcgatttgtg t 21 

<210> 7 

<211> 20 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<210> 8 

<211> 21 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 



7 



tgagaatatc accggaattg 



20 



<400> 8 

agctcgacat actgttcttc c 



21 



WO 2004/063359 



PCT/EP2004/000099 



29/357 



9 

24 
,> DNA 
i3> Artificial 

<220> 

<223> Primer 
<400> 9 

gtgaatggaa atcccatcgc tgtc 24 

<210> 10 
<211> 24 
<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<210> 11 
<211> 1771 
<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS 

<222> (166) .. (1155) 
<400> 11 

ggcacgagct tgcacgcaag tcagcgcgcg caagtcaaca cctgccggtc cacagcctca . 60 
aataataaag agctcaagcg tttgtgcgcc tcgacgtggc cagtctgcac tgccttgaac 120 



<400> 



10 



agtgggtact ctaaaggcca tacc 



24 



ccgcgagtct cccgccgcac tgactgccat agcacagcta gacga atg cag eta gca 177 

Met Gin Leu Ala 
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gcg aca gta atg ttg gag cag ctt acc gga age get gag gca etc aag 225 
Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala Glu Ala Leu Lys 
5 -10 15 20 

gag aag gag aag gag gtt gca ggc age tct gac gtg ttg cgt aca tgg 273 
Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp Val Leu Arg Thr Trp 
25 30 35 

gcg acc cag tac teg ctt ccg tea gaa gag tea gac gcg gee cgc ccg 321- 
Ala Thr Gin Tyr Ser . Leu Pro Ser Glu Glu Ser Asp Ala Ala Arg Pro 
40 45 50 

gga ctg aag aat gee tac aag cca cca cct tec gac aca aag ggc ate 369 
Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp Thr Lys Gly lie 
55 60 65 

aca atg gcg eta cgt gtc ate ggc tec tgg gee gca gtg ttc etc cac 417 
Thr Met Ala Leu Arg Val He Gly Ser Trp Ala Ala Val Phe Leu His 
70 75 80 

gee att ttt caa ate aag ctt ccg acc tec ttg gac cag ctg cac tgg 465 
Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp Gin Leu His Trp 
85 90 95 100 

ctg ccc gtg tea gat gee aca get cag ctg gtt age ggc acg age age 513 
Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser Gly Thr Ser Ser 
105 110 H5 



561 



ctg etc gac ate gtc gta gta ttc ttt gtc ctg gag ttc ctg tac aca 
Leu Leu Asp lie Val Val Val Phe Phe Val Leu- Glu Phe Leu Tyr Thr 
120 125 130 



ggc ctt ttt ate acc acg cat gat get atg cat ggc acc ate gec atg 609 
Gly Leu Phe He Thr Thr His Asp Ala Met His Gly Thr He Ala Met 
135 - 140 145 



aga aac agg cag ctt aat gac ttc ttg ggc aga gta tgc ate tec ttg 
Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val Cys He Ser Leu 
150 155 160 



657 



849 



897 
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tac gcc tgg ttt gat tac aac atg ctg cac cgc aag cat tgg gag cac 705 

Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys His Trp Glu His 
165 170 175 180 

cac aac cac act ggc gag gtg ggc aag gac cct gac ttc cac agg gga 753 
His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp Phe His Arg Gly 
185 190 195 

aac cct ggc att gtg ccc tgg ttt gcc age ttc atg tec age tac atg 801 
Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met 
200 205 210 

teg atg tgg cag ttt gcg cgc etc gca tgg tgg acg gtg gtc atg cag 
Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr Val Val Met Gin 
215 220 225 

ctg ctg ggt gcg cca atg gcg aac ctg ctg gtg ttc atg gcg gcc gcg 
Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala 
230 235 240 

ccc ate ctg tec gcc ttc cgc ttg ttc tac ttt ggc acg tac atg ccc 
Pro He Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Met Pro 
245 250 255 260 

cac aag cct gag cct ggc gcc gcg tea ggc tct tea cca gcc gtc atg 
His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser Pro Ala Val Met 
265 270 275 

aac tgg tgg aag teg cgc act age cag gcg tec gac ctg gtc age ttt 
Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp Leu Val Ser Phe 
280 285 290 

ctg ace tgc tac cac ttc gac ctg cac tgg gag cac cac cgc tgg ccc 
Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His His Arg Trp Pro 
295 300 305 

ttc gcc ccc tgg tgg gag ctg ccc aac tgc cgc cgc ctg tct ggc cga 1137 
Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg Leu Ser Gly Arg 
310 315 320 



945 



993 



1041 



1089 



ggt ctg gtt cct gcc tag ctggacacac tgcagtgggc cctgctgcca 
Gly Leu Val Pro Ala 



1185 
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325 



gctgggcatg caggttgtgg caggactggg tgaggtgaaa agctgcaggc gctgctgccg 
gacacgctgc atgggctacc ctgtgtagct gccgccacta ggggaggggg tttgtagctg 
tcgagcttgc cccatggatg aagctgtgta gtggtgcagg gagtacaccc acaggccaac 
acccttgcag gagatgtctt gcgtcgggag gagtgttggg cagtgtagat gctatgattg 
tatcttaatg ctgaagcctt taggggagcg acacttagtg ctgggcaggc aacgccctgc 
aaggtgcagg cacaagctag gctggacgag gactcggtgg caggcaggtg aagaggtgcg 
ggagggtggt gccacaccca ctgggcaaga ccatgctgca atgctggcgg tgtggcagtg 
agagctgcgt gattaactgg gctatggatt gtttgagcag tctcacttat tctttgatat 
agatactggt caggcaggtc aggagagtga gtatgaacaa gttgagaggt ggtgcgctgc 
ccctgcgctt atgaagctgt aacaataaag tggttcaaaa aaaaaa 

<210> 12 
<211> 329 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 12 

Met Gin Leu Ala Ala Thr Val Met Leu Glu Gin Leu Thr Gly Ser Ala 
15 10 15 

Glu Ala Leu Lys Glu Lys Glu Lys Glu Val Ala Gly Ser Ser Asp -Val 



Leu Arg Thr Trp Ala Thr Gin Tyr Ser Leu Pro Ser Glu Glu Ser Asp 



1245 
1305 
1365 
1425 
1485 
1545 
1605 
1665 
1725 
1771 



20 



25 



30 



35 



40 



45 
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Ala Ala Arg Pro Gly Leu Lys Asn Ala Tyr Lys Pro Pro Pro Ser Asp 
50 55 60 



Thr Lys Gly lie Thr Met Ala Leu Arg Val lie Gly Ser Trp Ala Ala 
65 70 75 80 



Val Phe Leu His Ala He Phe Gin He Lys Leu Pro Thr Ser Leu Asp 
85 90 95 



Gin Leu His Trp Leu Pro Val Ser Asp Ala Thr Ala Gin Leu Val Ser 
100 105 HO 



Gly Thr Ser Ser Leu Leu Asp He Val Val Val Phe Phe Val Leu Glu 
115 120 125 



Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp Ala Met His Gly 
130 135 140 



Thr He Ala Met Arg Asn Arg Gin Leu Asn Asp Phe Leu Gly Arg Val 
145 150 155 160 



Cys He Ser Leu Tyr Ala Trp Phe Asp Tyr Asn Met Leu His Arg Lys 
165 170 175 



His Trp Glu His His Asn His Thr Gly Glu Val Gly Lys Asp Pro Asp 
180 185 190 



Phe His Arg Gly Asn Pro Gly He Val Pro Trp Phe Ala Ser Phe Met 
195 200 205 



Ser Ser Tyr Met Ser Met Trp Gin Phe Ala Arg Leu Ala Trp Trp Thr 
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Val Val Met Gin Leu Leu Gly Ala Pro Met Ala Asn Leu Leu Val Phe 
225 230 235 240 



Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu Phe Tyr Phe Gly 
245 250 255 



Thr Tyr Met Pro His Lys Pro Glu Pro Gly Ala Ala Ser Gly Ser Ser 
260 265 270 



Pro Ala Val Met Asn Trp Trp Lys Ser Arg Thr Ser Gin Ala Ser Asp 
275 280 285 



Leu Val Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp Glu His 
290 295 300 



His Arg Trp Pro Phe Ala Pro Trp Trp Glu Leu Pro Asn Cys Arg Arg 
305 310 315 320 



Leu Ser Gly Arg Gly Leu Val Pro Ala 
325 

<210> 13 
<211> 1662 
<212> DNA 

<213> Haeraatococcus pluvialis 
<220> 

<221> CDS 

<222> (168) . . (1130) 

<400> 13 
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cggggcaact caagaaattc aacagctgca agcgcgcccc agcctcacag cgccaagtga 60 

gctatcgacg tggttgtgag cgctcgacgt ggtccactga cgggcctgtg agcctctgcg 120 

ctccgtcctc tgccaaatct cgcgtcgggg cctgcctaag tcgaaga atg cac gtc 176 

Met His Val 
1 

gca teg gca eta atg gtc gag cag aaa ggc agt gag gca get get tec 224 
Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala Ala Ala Ser 
5 10 15 

age cca gac gtc ttg aga gcg tgg gcg aca cag tat cac atg cca tec 272 
Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His Met Pro Ser 
20 25 30 35 

gag teg tea gac gca get cgt cct gcg eta aag cac gee tac aaa cct 320 
Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala Tyr Lys Pro 
40 45 50 

cca gca tct gac gec aag ggc ate acg atg gcg ctg acc ate att ggc 3 68 

Pro Ala Ser Asp Ala Lys Gly He Thr Met Ala Leu Thr He He Gly 
55 60 65 

acc tgg acc gca gtg ttt tta cac gca ata ttt caa ate agg eta ccg 416 
Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He Arg Leu Pro 
70 75 80 

aca tec atg gac cag ctt cac tgg ttg cct gtg tec gaa gee aca gee 464 
Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu Ala Thr Ala 
85 90 95 

cag ctt ttg ggc gga age age age eta ctg cac ate get gca gtc ttc 512 
Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala Ala Val Phe 
100 105 110 115 

att gta ctt gag ttc ctg tac act ggt eta ttc ate acc aca cat gac 560 
He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr Thr His Asp 
120 125 130 



gca atg cat ggc acc ata get ttg agg cac agg cag etc aat gat etc 
Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu Asn Asp Leu 



608 
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135 140 145 



ctt ggc aac ate tgc ata tea ctg tac gec tgg ttt gac tac age atg 656 
Leu Gly Asn lie Cys lie Ser Leu Tyr Ala Trp Phe Asp Tyr Ser Met 
150 155 160 

ctg cat cgc aag cac tgg gag cac cac aac cat act ggc gaa gtg ggg 704 
Leu His Arg Lys His Trp Glu His His Asn His Thr Gly Glu Val Gly 
165 170 175 

aaa gac cct gac ttc cac aag gga aat ccc ggc ctt gtc ccc tgg ttc 752 
Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val Pro Trp Phe 
180 185 190 195 

gee age ttc atg tec age tac atg tec ctg tgg cag ttt gee egg ctg 800 
Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe Ala Arg Leu 
200 205 210 

gca tgg tgg gca gtg gtg atg caa atg ctg ggg gcg ccc atg gca aat 848 
Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala, Pro Met Ala Asn 
215 220 225 

etc eta gtc ttc atg get gca gee cca ate ttg tea gca ttc cgc etc 896 
Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala Phe Arg Leu 
230 235 240 

ttc tac ttc ggc act tac ctg cca cac aag cct gag cca ggc cct gca 944 
Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro Gly Pro Ala 
245 250 255 

gca ggc tct cag gtg atg gee tgg ttc agg gee aag aca agt gag gca 992 
Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr Ser Glu Ala 
260 265 270 275 

tct gat gtg atg agt ttc ctg aca tgc tac cac ttt gac ctg cac tgg 1040 
Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp Leu His Trp 
280 285 290 



gag cac cac agg tgg ccc ttt gee ccc tgg tgg cag ctg ccc cac tgc 
Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu Pro His Cys 
295 300 305 



1088 
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cgc cgc ctg tec ggg cgt ggc ctg gtg cct gec ttg gca tga 
Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Ala Leu Ala 



1130 



310 



315 



320 



cctggtccct ccgctggtga cccagcgtct gcacaagagt gtcatgetac. agggtgctgc 1190 

ggccagtggc agcgcagtgc actctcagcc tgtatggggc taccgctgtg ccactgagca 1250 

ctgggcatgc cactgagcac tgggcgtgct actgagcaat gggcgtgcta ctgagcaatg 1310 

ggcgtgctac tgacaatggg cgtgctactg gggtctggca gtggctagga tggagtttga 1370 

tgcattcagt agcggtggcc aacgtcatgt ggatggtgga agtgctgagg ggtttaggca 1430 

geeggcattt gagagggcta agttataaat cgcatgctgc tcatgcgcac atatctgeae 1490 

acagecaggg aaatcccttc gagagtgatt atgggacact tgtattggtt tegtgetatt 1550 

gttttattca gcagcagtac ttagtgaggg tgagagcagg gtggtgagag tggagtgagt 1610 

gagtatgaac ctggtcagcg aggtgaacag cctgtaatga atgactctgt ct 1662 

<210> 14 
<211> 320 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 14 

Met His Val Ala Ser Ala Leu Met Val Glu Gin Lys Gly Ser Glu Ala 
15 10 15 

Ala Ala Ser Ser Pro Asp Val Leu Arg Ala Trp Ala Thr Gin Tyr His 



20 



25 



30 



Met Pro Ser Glu Ser Ser Asp Ala Ala Arg Pro Ala Leu Lys His Ala 
35 40 45 
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Tyr Lys Pro Pro Ala Ser Asp Ala Lys Gly lie Thr Met Ala Leu Thr 
50 55 60 



He He Gly Thr Trp Thr Ala Val Phe Leu His Ala He Phe Gin He 
65 70 75 80 



Arg Leu Pro Thr Ser Met Asp Gin Leu His Trp Leu Pro Val Ser Glu 
85 90 95 



Ala Thr Ala Gin Leu Leu Gly Gly Ser Ser Ser Leu Leu His He Ala 
100 105 110 



Ala Val Phe He Val Leu Glu Phe Leu Tyr Thr Gly Leu Phe He Thr 
115 120 125 



Thr His Asp Ala Met His Gly Thr He Ala Leu Arg His Arg Gin Leu 
130 135 140 



Asn Asp Leu Leu Gly Asn He Cys He Ser Leu Tyr Ala Trp Phe Asp 
145 150 155 160 



Tyr Ser Met Leu His Arg Lys His Trp Glu His His Asn His Thr Gly 
165 170 175 



Glu Val Gly Lys Asp Pro Asp Phe His Lys Gly Asn Pro Gly Leu Val 
180 185 190 



Pro Trp Phe Ala Ser Phe Met Ser Ser Tyr Met Ser Leu Trp Gin Phe 
195 200 205 



Ala Arg Leu Ala Trp Trp Ala Val Val Met Gin Met Leu Gly Ala Pro 
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210 



215 
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220 
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Met Ala Asn Leu Leu Val Phe Met Ala Ala Ala Pro lie Leu Ser Ala 
225 230 235 240 



Phe Arg Leu Phe Tyr Phe Gly Thr Tyr Leu Pro His Lys Pro Glu Pro 
245 250 255 



Gly Pro Ala Ala Gly Ser Gin Val Met Ala Trp Phe Arg Ala Lys Thr 
260 265 270 



Ser Glu Ala Ser Asp Val Met Ser Phe Leu Thr Cys Tyr His Phe Asp 
275 280 285 



Leu His Trp Glu His His Arg Trp Pro Phe Ala Pro Trp Trp Gin Leu 
290 295 300 



Pro His Cys Arg Arg Leu Ser Gly Arg Gly Leu Val Pro Aia Leu Ala 
305 310 315 320 



<210> 15 

<211> 729 

<212> DNA 

<213> Agrobacterium aurantiacum 
<220> 

<221> CDS 

<222> (1)..(729) 

<400> 15 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec acc age ctg 48 
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



WO 2004/063359 

ate gtc teg ggc ggc ate ate gee get 

lie Val Ser Gly Gly He He Ala Ala 
20 25 



PCT/EP2004/000099 

40/357 

tgg ctg gee ctg cat gtg cat 96 
Trp Leu Ala ieu His Val His 
30 



gcg ctg tgg ttt ctg gac gca gcg gcg cat ccc ate ctg gcg ate gca 144 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 

aat ttc ctg ggg ctg ace tgg ctg teg gtc gga ttg ttc ate ate gcg 192 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



cat gac gcg atg cac ggg teg gtg gtg ccg ggg cgt ccg cgc gee aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gee gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



cgc aag atg ate gtc aag cac atg gee cat cac cgc cat gee gga acc 33 6 

Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 HO 



gac gac gac ccc gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gee 384 

Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 

Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



gtc ate gtg acg gtc tat gcg ctg ate ctt ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



gtg gtc ttc tgg ccg ctg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc acc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
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185 
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190 



gac cgc cac aat gcg egg teg teg egg ate age gac ccc gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg lie Ser Asp Pro Val Ser Leu 
195 200 205 

ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 672 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 

ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<210> 16 

<211> 242 

<212> PRT 

<213> Agrobacterium aurantiacum 

<400> 16 



Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



lie Val Ser Gly Gly lie He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala He Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 
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His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 



Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 



WO 2004/063359 
225 230 
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235 
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240 



Thr Ala 



<210> 17 

<211> 1631 

<212> DNA 

<213> Alcaligenes sp. 



<220> 

<221> CDS 

<222> (99).. (827) 

<400> 17 

ctgcaggccg ggcccggtgg ccaatggtcg caaccggcag gactggaaca ggacggcggg 60 

ccggtctagg ctgtcgccct acgcagcagg agtttcgg atg tec gga egg aag cct 116 

Met Ser Gly Arg Lys Pro 
1 5 

ggc aca act ggc gac acg ate gtc aat etc ggt ctg acc gec gcg ate 164 
Gly Thr Thr Gly Asp Thr lie Val Asn Leu Gly Leu Thr Ala Ala lie 
10 15 20 

ctg ctg tgc tgg ctg gtc ctg cac gec ttt acg eta tgg ttg eta gat 212 
Leu Leu Cys Trp Leu Val Leu His Ala Phe Thr Leu Trp Leu Leu Asp 
25 30 35 



gcg gec gcg cat ccg ctg ctt gec gtg ctg tgc ctg get ggg ctg acc 260 
Ala Ala Ala His Pro Leu Leu Ala Val Leu Cys Leu Ala Gly Leu Thr 
40 45 50 

tgg ctg teg gtc ggg ctg ttc ate ate gcg cat gac gca atg cac ggg 308 
Trp Leu Ser Val Gly Leu Phe lie He Ala His Asp Ala Met His Gly 
55 60 65 70 

tec gtg gtg ccg ggg egg ccg cgc gec aat gcg gcg ate ggg caa ctg 356 
Ser Val Val Pro Gly Arg Pro Arg Ala Asn Ala Ala He Gly Gin Leu 
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75 80 85 



gcg ctg tgg etc tat gcg ggg ttc teg tgg ccc aag ctg ate gec aag 404 
Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp Pro Lys Leu lie Ala Lys 
90 95 100 

cac atg acg cat *cac egg cac gee ggc ace gac aac gat ccc gat ttc 452 
His Met Thr His His Arg His Ala Gly Thr Asp Asn Asp Pro Asp Phe 
105 110 115 

ggt cac gga ggg ccc gtg cgc tgg tac ggc age ttc gtc tec ace tat 500 
Gly His Gly Gly Pro Val Arg Trp Tyr Gly Ser Phe Val Ser Thr Tyr 
120 125 130 

ttc ggc tgg cga gag gga ctg ctg eta ccg gtg ate gtc ace acc tat 548 
Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro Val lie Val Thr Thr Tyr 
135 140 145 150 

gcg ctg ate ctg ggc gat cgc tgg atg tat gtc ate ttc tgg ccg gtc 596 
Ala Leu lie Leu Gly Asp Arg Trp Met Tyr Val lie Phe Trp Pro Val 
155 160 165 

ccg gee gtt ctg gcg teg ate cag att ttc gtc ttc gga act tgg ctg 644 
Pro Ala Val Leu Ala Ser lie Gin lie Phe Val Phe Gly Thr Trp Leu 
170 175 180 

ccc cac cgc ccg gga cat gac gat ttt ccc gac egg cac aac gcg agg 692 
Pro His Arg Pro Gly His Asp Asp Phe Pro Asp Arg His Asn Ala Arg 
185 190 195 

teg acc ggc ate ggc gac ccg ttg tea eta ctg acc tgc ttc cat ttc 740 
Ser Thr Gly He Gly Asp Pro Leu Ser Leu Leu Thr Cys Phe His Phe 
200 205 210 

ggc ggc tat cac cac gaa cat cac ctg cat ccg cat gtg ccg tgg tgg 788 
Gly Gly Tyr His His Glu His His Leu His Pro His Val Pro Trp Trp 
215 220 225 230 



cgc ctg cct cgt aca cgc aag acc gga ggc cgc gca tga cgcaattcct 
Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly Arg Ala 
235 240 



837 
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cattgtcgtg gcgacagtcc tcgtgatgga gctgaccgcc tattccgtcc accgctggat 897 

tatgcacggc cccctaggct ggggctggca caagtcccat cacgaagagc acgaccacgc 957 

gttggagaag aacgacctct acggcgtcgt cttcgcggtg ctggcgacga tcctcttcac 1017 

cgtgggcgcc tattggtggc cggtgctgtg gtggatcgcc ctgggcatga cggtctatgg 1077 

gttgatctat ttcatcctgc acgacgggct tgtgcatcaa cgctggccgt ttcggtatat 1137 

tccgcggcgg ggctatttcc gcaggctcta ccaagctcat cgcctgcacc acgcggtcga 1197 

ggggcgggac cactgcgtca gcttcggctt catctatgcc ccacccgtgg acaagctgaa 1257 

gcaggatctg aagcggtcgg gtgtcctgcg cccccaggac gagcgtccgt cgtgatctct 1317 

gatcccggcg tggccgcatg aaatccgacg tgctgctggc aggggccggc cttgccaacg 1377 

gactgatcgc gctggcgatc cgcaaggcgc ggcccgacct tcgcgtgctg ctgctggacc 1437 

gtgcggcggg cgcctcggac gggcatactt ggtcctgcca cgacaccgat ttggcgccgc 1497 

actggctgga ccgcctgaag ccgatcaggc gtggcgactg gcccgatcag gaggtgcggt 1557 

tcccagacca ttcgcgaagg ctccgggccg gatatggctc gatcgacggg cgggggctga 1617 

tgcgtgcggt gacc 1631 

<210> 18 
<211> 242 
<212> PRT 

<213> Alcaligenes sp. 
<400> 18 

Met Ser Gly Arg Lys Pro Gly Thr Thr Gly Asp Thr lie Val Asn Leu 
15 10 15 

Gly Leu Thr Ala Ala lie Leu Leu Cys Trp Leu Val Leu His Ala Phe 
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25 
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30 



Thr Leu Trp Leu Leu Asp Ala Ala Ala His Pro Leu Leu Ala Val Leu 
35 40 45 



Cys Leu Ala Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 .80 



Ala Ala He Gly Gin Leu Ala Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Pro Lys Leu He Ala Lys His Met Thr His His Arg His Ala Gly Thr 
100 105 110 



Asp Asn Asp Pro Asp Phe Gly His Gly Gly Pro Val Arg Trp Tyr Gly 
115 120 125 



Ser Phe Val Ser Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val He Val Thr Thr Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val He Phe Trp Pro Val Pro Ala Val Leu Ala Ser He Gin He Phe 
165 170 175 



Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Asp Phe Pro 
180 185 190 
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Asp Arg His Asn Ala Arg Ser Thr Gly lie Gly Asp Pro Leu Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro His Val Pro Trp Trp Arg Leu Pro Arg Thr Arg Lys Thr Gly Gly 
225 230 235 240 



Arg Ala 



<210> 19 

<211> 729 

<212> DNA 

<213> Paracoccus marcusii 



<220> 

<221> CDS 

<222> (1)..(729) 

<400> 19 

atg age gca cat gec ctg ccc aag gca gat ctg acc gec aca age ctg 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 

15 10 15 

ate gtc teg ggc ggc ate ate gee gca tgg ctg gee ctg cat gtg cat 
lie Val Ser Gly Gly He He Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 

gcg ctg tgg ttt ctg gac gcg gcg gec cat ccc ate ctg gcg gtc gcg 
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro He Leu Ala Val Ala 
35 40 45 

aat ttc ctg ggg ctg acc tgg ctg teg gtc gga ttg ttc ate ate gcg 
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe He He Ala 



96 



144 



192 
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cat gac gcg atg cac ggg teg gtc gtg ccg ggg cgt ccg cgc gec aat 240 
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 .75 80 

gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gec gga ttt teg tgg 288 
Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 

cgc aag atg ate gtc aag cac atg gec cat cac cgc cat gec gga ace 336 
Arg Lys Met He Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 HO 

gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gec 384 
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 

cgc ttc ate ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 
Arg Phe He Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 

gtc ate gtg acg gtc tat gcg ctg ate ctg ggg gat cgc tgg atg tac 480 
Val He Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 

gtg gtc ttc tgg ccg ttg ccg teg ate ctg gcg teg ate cag ctg ttc 528 
Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 

gtg ttc ggc act tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 
Val Phe Gly Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 

gac cgc cat aat gcg egg teg teg egg ate age gac cct gtg teg ctg 624 
Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



ctg acc tgc ttt cat ttt ggc ggt tat cat cac gaa cac cac ctg cac 
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



672 
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ccg acg gtg ccg tgg tgg cgc ctg ccc age acc cgc acc aag ggg gac 720 
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 

acc gca tga 729 
Thr Ala 



<210> 20 
<211> 242 
<212> PRT 

<213> Paracoccus marcusii 
<400> 20 

Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 
15 10 15 



lie Val Ser Gly Gly lie lie Ala Ala Trp Leu Ala Leu His Val His 
20 25 30 



Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro lie Leu Ala Val Ala 
35 40 45 



Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe lie lie Ala 
50 55 60 



His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 
65 70 75 80 



Ala Ala Met Gly Gin Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 
85 90 95 



Arg Lys Met lie Val Lys His Met Ala His His Arg His Ala Gly Thr 
100 105 110 
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Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 
115 120 125 



Arg Phe lie Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 
130 135 140 



Val lie Val Thr Val Tyr Ala Leu He Leu Gly Asp Arg Trp Met Tyr 
145 150 155 160 



Val Val Phe Trp Pro Leu Pro Ser He Leu Ala Ser He Gin Leu Phe 
165 170 175 



Val Phe Gly. Thr Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 
180 185 190 



Asp Arg His Asn Ala Arg Ser Ser Arg He Ser Asp Pro Val Ser Leu 
195 200 205 



Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 
210 215 220 



Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 
225 230 235 240 



Thr Ala 



<210> 21 
<211> 1629 
<212> DNA 



WO 2004/063359 
<213> Synechocystis sp. 



51/357 
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<220> 

<221> CDS 

<222> (1)..(1629) 

<400> 21 

atg ate acc acc gat gtt gtc att att ggg gcg ggg cac aat ggc tta 48 

Met lie Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
1 5 10 15 



gtc tgt gca gec tat ttg etc caa egg ggc ttg ggg gtg acg tta eta 96 
Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 



gaa aag egg gaa gta cca ggg ggg gcg gee acc aca gaa get etc atg 144 
Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 



ccg gag eta tec ccc cag ttt cgc ttt aac cgc tgt gee att gac cac 192 
Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala He Asp His 
50 55 60 

gaa ttt ate ttt ctg ggg ccg gtg ttg cag gag eta aat tta gee cag 240 
Glu Phe He Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 ' 75 80 



tat ggt ttg gaa tat tta ttt tgt gac ccc agt gtt ttt tgt ccg ggg 288 
Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 

ctg gat ggc caa get ttt atg age tac cgt tec eta gaa aaa acc tgt 336 
Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu. Glu Lys Thr Cys 
100 105 110 

gee cac att gee acc tat age ccc cga gat gcg gaa aaa tat egg caa 3 84 

Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



ttt gtc aat tat tgg acg gat ttg etc aac get gtc cag cct get ttt 



432 
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Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe . 
130 * 135 140 

aat get ccg ccc cag get tta eta gat tta gee ctg aac tat ggt tgg 480 
Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 

gaa aac tta aaa tec gtg ctg gcg ate gee ggg teg aaa acc aag gcg 528 
Glu Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 

ttg gat ttt ate cgc act atg ate ggc tec ccg gaa gat gtg etc aat 576 
Leu Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 

gaa tgg ttc gac age gaa egg gtt aaa get cct tta get aga eta tgt 624 
Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



teg gaa att ggc get ccc cca tec caa aag ggt agt age tec ggc atg 672 
Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
210 215 220 

atg atg gtg gec atg egg cat ttg gag gga att gec aga cca aaa gga 72 0 

Met Met Val Ala Met Arg His Leu Glu Gly He Ala Arg Pro Lys Gly 
225 230 235 240 

ggc act gga gec etc aca gaa gec ttg gtg aag tta gtg caa gee caa 768 
Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 

999 gga aaa ate etc act gac caa acc gtc aaa egg gta ttg gtg gaa 816 
Gly Gly Lys He Leu Thr Asp Gin. Thr Val Lys Arg Val Leu Val Glu 
260 265 270 

aac aac cag gcg ate ggg gtg gag gta get aac gga gaa cag tac egg 864 
Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



gee aaa aaa ggc gtg att tct aac ate gat gec cgc cgt tta ttt ttg 
Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 



912 
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290 295 300 



caa ttg gtg gaa ccg ggg gcc eta gec aag gtg aat caa aac eta ggg 960 
Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 

gaa cga ctg gaa egg cgc act gtg aac aat aac gaa gcc att tta aaa 1008 
Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala lie Leu Lys 
325 330 335 



ate gat tgt gcc etc tec ggt tta ccc cac ttc act gcc atg gcc ggg 1056 
lie Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 

ccg gag gat eta acg gga act att ttg att gcc gac teg gta cgc cat 1104 
Pro Glu Asp Leu Thr Gly Thr lie Leu lie Ala Asp Ser Val Arg His 
355 360 365 

gtc gag gaa gcc cac gcc etc att gcc ttg ggg caa att ccc gat get 1152 
Val Glu Glu Ala His Ala Leu lie Ala Leu Gly Gin lie Pro Asp Ala 
370 375 380 

aat ccg tct tta tat ttg gat att ccc act gta ttg gac ccc ace atg 1200 
Asn Pro Ser Leu Tyr Leu Asp lie Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 

gcc ccc cct ggg cag cac ace etc tgg ate gaa ttt ttt gcc ccc tac 1248 
Ala Pro Pro Gly Gin His Thr Leu Trp He Glu Phe Phe Ala Pro Tyr 
405 410 415 

cgc ate gcc ggg ttg gaa ggg aca ggg tta atg ggc aca ggt tgg ace 1296 
Arg He Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 

gat gag tta aag gaa aaa gtg gcg gat egg gtg att gat aaa tta acg 1344 
Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val He Asp Lys Leu Thr 
435 440 445 



gac tat gcc cct aac eta aaa tct ctg ate att ggt cgc cga gtg gaa 
Asp Tyr Ala Pro Asn Leu Lys Ser Leu He He Gly Arg Arg Val Glu 
450 455 460 



1392 
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agt ccc gcc gaa ctg gcc caa egg ctg gga agt tac aac ggc aat gtc 1440 
Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 

tat cat ctg gat atg agt ttg gac caa atg atg ttc etc egg cct eta 1488 
Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 

ccg gaa att gcc aac tac caa acc ccc ate aaa aat ctt tac tta aca 1536 
Pro Glu lie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 

ggg gcg ggt acc cat ccc ggt ggc tec ata tea ggt atg ccc ggt aga 1584 
Gly- Ala Gly Thr His Pro Gly Gly Ser He Ser Gly Met Pro Gly Arg . 
515 520 525 

aat tgc get egg gtc ttt tta aaa caa caa cgt cgt ttt tgg taa 1629 
Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 

<210> 22 
<211> 542 
<212> PRT 

<213> Synechocystis sp. 
<400> 22 

Met He Thr Thr Asp Val Val He He Gly Ala Gly His Asn Gly Leu 
15 10 15 

Val Cys Ala Ala Tyr Leu Leu Gin Arg Gly Leu Gly Val Thr Leu Leu 
20 25 30 

Glu Lys Arg Glu Val Pro Gly Gly Ala Ala Thr Thr Glu Ala Leu Met 
35 40 45 
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Pro Glu Leu Ser Pro Gin Phe Arg Phe Asn Arg Cys Ala lie Asp His 
50 55 60 



Glu Phe lie Phe Leu Gly Pro Val Leu Gin Glu Leu Asn Leu Ala Gin 
65 70 75 80 



Tyr Gly Leu Glu Tyr Leu Phe Cys Asp Pro Ser Val Phe Cys Pro Gly 
85 90 95 



Leu Asp Gly Gin Ala Phe Met Ser Tyr Arg Ser Leu Glu Lys Thr Cys 
100 105 110 



Ala His He Ala Thr Tyr Ser Pro Arg Asp Ala Glu Lys Tyr Arg Gin 
115 120 125 



Phe Val Asn Tyr Trp Thr Asp Leu Leu Asn Ala Val Gin Pro Ala Phe 
130 135 140 



Asn Ala Pro Pro Gin Ala Leu Leu Asp Leu Ala Leu Asn Tyr Gly Trp 
145 150 155 160 



Glu Asn Leu Lys Ser Val Leu Ala He Ala Gly Ser Lys Thr Lys Ala 
165 170 175 



Leu Asp Phe He Arg Thr Met He Gly Ser Pro Glu Asp Val Leu Asn 
180 185 190 



Glu Trp Phe Asp Ser Glu Arg Val Lys Ala Pro Leu Ala Arg Leu Cys 
195 200 205 



Ser Glu He Gly Ala Pro Pro Ser Gin Lys Gly Ser Ser Ser Gly Met 
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210 215 220 



Met Met Val Ala Met Arg His Leu Glu Gly lie Ala Arg Pro Lys Gly 
225 230 235 240 



Gly Thr Gly Ala Leu Thr Glu Ala Leu Val Lys Leu Val Gin Ala Gin 
245 250 255 



Gly Gly Lys lie Leu Thr Asp Gin Thr Val Lys Arg Val Leu Val Glu 
260 265 270 



Asn Asn Gin Ala He Gly Val Glu Val Ala Asn Gly Glu Gin Tyr Arg 
275 280 285 



Ala Lys Lys Gly Val He Ser Asn He Asp Ala Arg Arg Leu Phe Leu 
290 295 300 



Gin Leu Val Glu Pro Gly Ala Leu Ala Lys Val Asn Gin Asn Leu Gly 
305 310 315 320 



Glu Arg Leu Glu Arg Arg Thr Val Asn Asn Asn Glu Ala He Leu Lys 
325 330 335 



He Asp Cys Ala Leu Ser Gly Leu Pro His Phe Thr Ala Met Ala Gly 
340 345 350 



Pro Glu Asp Leu Thr Gly Thr He Leu He Ala Asp Ser Val Arg His 
355 360 365 



Val Glu Glu Ala His Ala Leu He Ala Leu Gly Gin He Pro Asp Ala 
370 375 380 
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Asn Pro Ser Leu Tyr Leu Asp lie Pro Thr Val Leu Asp Pro Thr Met 
385 390 395 400 



Ala Pro Pro Gly Gin His Thr Leu Trp lie Glu Phe Phe Ala Pro Tyr 
405 410 415 



Arg lie Ala Gly Leu Glu Gly Thr Gly Leu Met Gly Thr Gly Trp Thr 
420 425 430 



Asp Glu Leu Lys Glu Lys Val Ala Asp Arg Val lie Asp Lys Leu Thr 
435 440 445 



Asp Tyr Ala Pro Asn Leu Lys Ser Leu lie lie Gly Arg Arg Val Glu 
450 455 460 



Ser Pro Ala Glu Leu Ala Gin Arg Leu Gly Ser Tyr Asn Gly Asn Val 
465 470 475 480 



Tyr His Leu Asp Met Ser Leu Asp Gin Met Met Phe Leu Arg Pro Leu 
485 490 495 



Pro Glu lie Ala Asn Tyr Gin Thr Pro lie Lys Asn Leu Tyr Leu Thr 
500 505 510 



Gly Ala Gly Thr His Pro Gly Gly Ser lie Ser Gly Met Pro Gly Arg 
515 520 525 



Asn Cys Ala Arg Val Phe Leu Lys Gin Gin Arg Arg Phe Trp 
530 535 540 



<210> 23 
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<211> 776 
<212> DNA 

<213> Bradyrhizobium sp. 



<220> 

<221> CDS 

<222> (1)..(774) 

<400> 23 

atg cat gca gca acc gcc aag get act gag ttc ggg gec tct egg cgc 48 
Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
15 10 15 

gac gat gcg agg cag cgc cgc gtc ggt etc acg ctg gcc gcg gtc ate 96 
Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 

ate gcc gcc tgg ctg gtg ctg cat gtc ggt ctg atg ttc ttc tgg ccg 144 
lie Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 

ctg acc ctt cac age ctg ctg ccg get ttg cct ctg gtg gtg ctg cag 192 
Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 

acc tgg etc tat gta ggc ctg ttc ate ate gcg cat gac tgc atg cac 240 
Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 

ggc teg ctg gtg ccg ttc aag ccg cag gtc aac cgc cgt ate gga cag 288 
Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 

etc tgc ctg ttc etc tat gcc ggg ttc tec ttc gac get etc aat gtc 336 
Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 110 

gag cac cac aag cat cac cgc cat ccc ggc acg gcc gag gat ccc gat 3 84 

Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 
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ttc gac gag gtg ccg ccg cac ggc ttc tgg cac tgg ttc gcc age ttt 432 
Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 

ttc ctg cac tat ttc ggc tgg aag cag gtc gcg ate ate gca gcc gtc 480 
Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 160 

teg ctg gtt tat cag etc gtc ttc gcc gtt ccc ttg cag aac ate ctg 528 
Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 

ctg ttc tgg gcg ctg ccc ggg ctg ctg teg gcg ctg cag ctg ttc ace 576 
Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 

ttc ggc ace tat ctg ccg cac aag ccg gcc acg cag ccc ttc gcc gat 624 
Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 

cgc cac aac gcg egg acg age gaa ttt ccc gcg tgg ctg teg ctg ctg 672 
Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 

ace tgc ttc cac ttc ggc ttt cat cac gag cat cat ctg cat ccc gat 720 
Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 235 240 

gcg ccg tgg tgg egg ctg ccg gag ate aag egg egg gcc ctg gaa agg 768 
Ala Pro Trp Trp Arg Leu Pro Glu He Lys Arg Arg Ala Leu Glu Arg 
245 250 255 

cgt gac ta 776 
Arg Asp 



<210> 24 

<211> 258 

<212> PRT 

<213> Bradyrhizobium sp. 



WO 2004/063359 
<400> 24 
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Met His Ala Ala Thr Ala Lys Ala Thr Glu Phe Gly Ala Ser Arg Arg 
1 5 10 15 



Asp Asp Ala Arg Gin Arg Arg Val Gly Leu Thr Leu Ala Ala Val He 
20 25 30 



He Ala Ala Trp Leu Val Leu His Val Gly Leu Met Phe Phe Trp Pro 
35 40 45 



Leu Thr Leu His Ser Leu Leu Pro Ala Leu Pro Leu Val Val Leu Gin 
50 55 60 



Thr Trp Leu Tyr Val Gly Leu Phe He He Ala His Asp Cys Met His 
65 70 75 80 



Gly Ser Leu Val Pro Phe Lys Pro Gin Val Asn Arg Arg He Gly Gin 
85 90 95 



Leu Cys Leu Phe Leu Tyr Ala Gly Phe Ser Phe Asp Ala Leu Asn Val 
100 105 HO 



Glu His His Lys His His Arg His Pro Gly Thr Ala Glu Asp Pro Asp 
115 120 125 



Phe Asp Glu Val Pro Pro His Gly Phe Trp His Trp Phe Ala Ser Phe 
130 135 140 



Phe Leu His Tyr Phe Gly Trp Lys Gin Val Ala He He Ala Ala Val 
145 150 155 160 
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Ser Leu Val Tyr Gin Leu Val Phe Ala Val Pro Leu Gin Asn He Leu 
165 170 175 



Leu Phe Trp Ala Leu Pro Gly Leu Leu Ser Ala Leu Gin Leu Phe Thr 
180 185 190 



Phe Gly Thr Tyr Leu Pro His Lys Pro Ala Thr Gin Pro Phe Ala Asp 
195 200 205 



Arg His Asn Ala Arg Thr Ser Glu Phe Pro Ala Trp Leu Ser Leu Leu 
210 215 220 



Thr Cys Phe His Phe Gly Phe His His Glu His His Leu His Pro Asp 
225 230 • 235 240 



Ala Pro Trp Trp Arg Leu Pro Glu He Lys Arg Arg Ala Leu Glu Arg 
245 250 255 



Arg Asp 



<210> 25 

<211> 777 

<212> DNA 

<213> Nostoc sp. 



<220> 

<221> CDS 

<222> (1)..(777) 



<400> 25 

atg gtt cag tgt caa cca tea tct ctg cat tea gaa aaa ctg gtg tta 48 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
15 10 15 
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ttg tea teg aca ate aga gat gat aaa. aat att aat aag ggt ata ttt 96 
Leu Ser Ser Thr lie Arg Asp Asp Lys Asn lie Asn Lys Gly He Phe 
20 25 30 

att gee tgc ttt ate tta ttt tta tgg gca att agt tta ate tta tta 144 
He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 

etc tea ata gat aca tec ata att cat aag age tta tta ggt ata gee 192 
Leu Ser He Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 

atg ctt tgg cag ace ttc tta tat aca ggt tta ttt att act get cat 240 
Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 

gat gee atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat 288 
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
85 90 95 

ttt ata ggt aag etc act eta ate ttg tat gga eta etc cct tat aaa 336 
Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 

gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat 384 
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 

tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg 432 
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

tat eta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga 480 
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 

tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa 528 
Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 



aat aat tta att ata ttt tgg atg ata cct tct att tta agt tea gta 



576 
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Asn Asn Leu lie He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 

caa eta ttt tat ttt ggt aca ttt ttg cct cat aaa aag eta gaa ggt 624 
Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 

ggt tat act aac ccc cat tgt gcg cgc agt ate cca tta cct ctt ttt 672 
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser He Pro Leu Pro Leu Phe 
210 215 220 

tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac 720 
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 

gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa get cac aaa ata 768 
Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys He 
245 250 255 

tct tta taa 777 
Ser Leu 



<210> 26 ' 

<211> 258 

<212> PRT 

<213> Nostoc sp. 

<400> 26 

Met Val Gin Cys Gin Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu 
15 10 15 



Leu Ser Ser Thr He Arg Asp Asp Lys Asn He Asn Lys Gly He Phe 
20 25 30 



He Ala Cys Phe He Leu Phe Leu Trp Ala He Ser Leu He Leu Leu 
35 40 45 
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Leu Ser lie Asp Thr Ser He He His Lys Ser Leu Leu Gly He Ala 
50 55 60 



Met Leu Trp Gin Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His 
65 70 75 80 

Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg He Asn Asn 
85 90 95 

Phe He Gly Lys Leu Thr Leu He Leu Tyr Gly Leu Leu Pro Tyr Lys 
100 105 110 



Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp 
115 120 125 

Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gin Asn Phe Phe Leu Trp 
130 135 140 

Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gin He Phe Gly 
145 150 155 160 

Leu Val Met He Phe His Gly Leu Lys Asn Leu Val His He Pro Glu 
165 170 175 

Asn Asn Leu He He Phe Trp Met He Pro Ser He Leu Ser Ser Val 
180 185 190 



Gin Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly 
195 200 205 
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Gly Tyr Thr Asn Pro His Cys Ala Arg Ser lie Pro Leu Pro Leu Phe 
210 215 220 



Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His 
225 230 235 240 



Glu Tyr Pro Gin Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys lie 
245 250 255 



Ser Leu 



<210> 27 

<211> 789 

<212> DNA 

<213> Nostoc punctiforme 



<220> 

<221> CDS 

<222> (1)..(789) 

<400> 27 

ttg aat ttt tgt gat aaa cca gtt age tat tat gtt gca ata gag caa 48 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin 
15 10 15 

tta agt get aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta 96 
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val lie Val lie Val 
20 . 25 30 

att att agt ctt tgg gta get agt ttg get ttt tta eta get att aat 144 
lie lie Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 

tat gee aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa 192 
Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 
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atg ttc ctt tat aca ggg eta ttt att act gca cat gat get atg cat 240 
Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 

ggg tea gtt tat cgt aaa aat ccc aaa att aat aat ttt ate ggt tea 288 
Gly Ser Val Tyr Arg Lys Asn Pro Lys lie Asn Asn Phe He Gly Ser 
85 90 95 

eta get gta gcg ctt tac get gtg ttt cca tat caa cag atg tta aag 336 
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 HO 

aat cat tgc tta cat cat cgt cat cct get age gaa gtt gac cca gat 384 
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 

ttt cat gat ggt aag aga aca aac get att ttc tgg tat etc cat ttc 432 
Phe His Asp Gly Lys Arg Thr Asn Ala He Phe Trp Tyr Leu His Phe 
130 135 140 

atg ata gaa tac tec agt tgg caa cag tta ata gta eta act ate eta 480 
Met He Glu Tyr Ser Ser Trp Gin Gin Leu He Val Leu Thr He Leu 
145 150 155 160 

ttt aat tta get aaa tac gtt ttg cac ate cat caa ata aat etc ate 528 
Phe. Asn Leu Ala Lys Tyr Val Leu His He His Gin He Asn Leu He 
165 170 175 

tta ttt tgg agt att cct cca att tta agt tec att caa ctg ttt tat 576 
Leu Phe Trp Ser He Pro Pro He Leu Ser Ser He Gin Leu Phe Tyr 
180 185 190 

ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat 624 
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 

ccc cat tgc age caa aca ata aaa ttg cca act ttt ttg tea ttt ate 672 
Pro His Cys Ser Gin Thr He Lys Leu Pro Thr Phe Leu Ser Phe He 
210 215 220 

get tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat 720 



WO 2004/063359 PCT/EP2004/000099 

67/357 

Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac 768 
Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 

aat tea gta acc aat teg taa 789 
Asn Ser Val Thr Asn Ser 
260 



<210> 28 
<211> 262 
<212> PRT 

<213> Nostoc punctif ornie 
<400> 28 

Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala lie Glu Gin 
15 10 15 



Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val He Val He Val 
20 25 ' 30 



He He Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala He Asn 
35 40 45 



Tyr Ala Lys Val Pro He Trp Leu He Pro He Ala He Val Trp Gin 
50 55 60 



Met Phe Leu Tyr Thr Gly Leu Phe He Thr Ala His Asp Ala Met His 
65 70 75 80 



Gly Ser Val Tyr Arg Lys Asn Pro Lys He Asn Asn Phe He Gly Ser 
85 90 95 
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Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gin Gin Met Leu Lys 
100 105 110 



Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp 
115 120 125 



Phe His Asp Gly Lys Arg Thr Asn Ala lie Phe Trp Tyr Leu His Phe 
130 135 140 



Met lie Glu Tyr Ser Ser Trp Gin Gin Leu lie Val Leu Thr lie Leu 
145 150 155 160 



Phe Asn Leu Ala Lys Tyr Val Leu His lie His Gin lie Asn Leu lie 
165 170 175 



Leu Phe Trp Ser lie Pro Pro lie Leu Ser Ser lie Gin Leu Phe Tyr 
180 185 190 



Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr 
195 200 205 



Pro His Cys Ser Gin Thr lie Lys Leu Pro Thr Phe Leu Ser Phe lie 
210 215 220 



Ala Cys Tyr His Phe Gly Tyr His. Glu Glu His His Glu Tyr Pro His 
225 230 235 240 



Val Pro Trp Trp Gin Leu Pro Ser Val Tyr Lys Gin Arg Val Phe Asn 
245 250 255 



Asn Ser Val Thr Asn Ser 
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260 



<210> 29 

<211> 762 

<212> DNA 

<213> Nostoc puncti forme 



<220> 

<221> CDS 

<222> (1)..(762) 



<400> 29 

gtg ate cag tta gaa caa cca etc agt cat caa gca aaa ctg act cca 48 
Val lie Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 



gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att get att gtc 96 
Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe lie Ala lie Val 
20 25 30 



att gtt age gca tgg gtc att age ctg agt tta tta ctt tec ctt gac 144 
lie Val Ser Ala Trp Val lie Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 



ate tea aag eta aaa ttt tgg atg tta ttg cct gtt ata eta tgg caa 192 
He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 



aca ttt tta tat acg gga tta ttt att aca tct cat gat gee atg cat 240 
Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 



ggc gta gta ttt ccc caa aac ace aag att aat cat ttg att gga aca 288 
Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 



ttg ace eta tec ctt tat ggt ctt tta cca tat caa aaa eta ttg aaa 336 
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 
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aaa cat tgg tta cac cac cac aat cca gca age tea ata gac ccg gat 384 
Lys His Trp Leu His His His Asn Pro Ala Ser Ser lie Asp Pro Asp 
115 120 125 

ttt cac aat ggt aaa cac caa agt ttc ttt get tgg tat ttt cat ttt 432 
Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 

atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att 480 
Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 
145 150 155 160 

tat aac ttt get aaa tac ata etc cat ate cca agt gat aat eta act 528 
Tyr Asn Phe Ala Lys Tyr He Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 

tac ttt tgg gtg eta ccc teg ctt tta agt tea tta caa tta ttc tat 576 
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag 624 
Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

cct cat tgt gee caa aca att age cgt cct att tgg tgg tea ttt ate 672 
Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
210 215 220 

acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat 720 
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag 762 
He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 



<210> 30 

<211> 253 

<212> PRT 

<213> Nostoc punctiforme 
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<400> 30 

Val He Gin Leu Glu Gin Pro Leu Ser His Gin Ala Lys Leu Thr Pro 
15 10 15 



Val Leu Arg Ser Lys Ser Gin Phe Lys Gly Leu Phe He Ala He Val 



20 25 30 



He Val Ser Ala Trp Val He Ser Leu Ser Leu Leu Leu Ser Leu Asp 
35 40 45 



He Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val He Leu Trp Gin 
50 55 60 



Thr Phe Leu Tyr Thr Gly Leu Phe He Thr Ser His Asp Ala Met His 
65 70 75 80 



Gly Val Val Phe Pro Gin Asn Thr Lys He Asn His Leu He Gly Thr 
85 90 95 



Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gin Lys Leu Leu Lys 
100 105 110 



Lys His Trp Leu His His His Asn Pro Ala Ser Ser He Asp Pro Asp 
115 120 125 



Phe His Asn Gly Lys His Gin Ser Phe Phe Ala Trp Tyr Phe His Phe 
130 135 140 



Met Lys Gly Tyr Trp Ser Trp Gly Gin He He Ala Leu Thr He He 
145 150 155 160 
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Tyr Asn Phe Ala Lys Tyr lie Leu His He Pro Ser Asp Asn Leu Thr 
165 170 175 

Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gin Leu Phe Tyr 
180 185 190 

Phe Gly Thr Phe Leu Pro His Ser Glu Pro He Gly Gly Tyr Val Gin 
195 200 205 

Pro His Cys Ala Gin Thr He Ser Arg Pro He Trp Trp Ser Phe He 
•210 215 220 

Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His 
225 230 235 240 

He Ser Trp Trp Gin Leu Pro Glu He Tyr Lys Ala Lys 
245 250 

<210> 31 
<211> 1608 
<212> DNA 

<213> Haematococcus pluvialis 
<220> 

<221> CDS 

<222> (3).. (971) 

<400> 31 

ct aca ttt cac aag ccc gtg age ggt gca age get ctg ccc cac ate 47 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His He 
15 10 15 



ggc cca cct cct cat etc cat egg tea ttt get get ace acg atg ctg 



95 
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Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu 
20 25 30 

teg aag ctg cag tea ate age gtc aag gee cgc cgc gtt gaa eta gee 143 

Ser Lys Leu Gin Ser He Ser Val Lys Ala Arg Arg Val Glu Leu Ala 
35 40 45 

cgc gac ate acg egg ccc aaa gtc tgc ctg cat get cag egg tgc teg 191 

Arg Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser 

50 55 60 

tta gtt egg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga 239 

Leu Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly 

65 70 75 

acc gtg cag get gee ggc gcg ggc gat gag cac age gec gat gta gca 287 

Thr Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala 
80 85 90 95 

etc cag cag ctt gac egg get ate gca gag cgt cgt gee egg cgc aaa 335 

Leu Gin Gin Leu Asp Arg Ala He Ala Glu Arg Arg Ala Arg Arg Lys 
100 105 110 

egg gag cag ctg tea tac cag get gee gee att gca gca tea, att ggc 383 

Arg Glu Gin Leu Ser Tyr Gin Ala Ala Ala He Ala Ala Ser He Gly 
115 120 125 

gtg tea ggc att gee ate ttc gee acc tac ctg aga ttt gee atg cac 431 

Val Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His 

130 135 140 

atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg get ggc act etc 479 

Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu 

145 150 155 

etc ttg gtg gtt ggt ggc gcg etc ggc atg gag atg tat gee cgc tat 527 

Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr 
160 165 170 175 



gca cac aaa gee ate tgg cat gag teg cct ctg ggc tgg ctg ctg cac 
Ala His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His 
180 185 190 



575 
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aag age cac cac aca cct cgc act gga ccc ttt gaa gec aac gac ttg 623 
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu 
195 200 205 

ttt gca ate ate aat gga ctg ccc gec atg etc ctg tgt ace ttt ggc 671 
Phe Ala lie lie Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly 
210 215 220 

ttc tgg ctg ccc aac gtc ctg ggg gcg gee tgc ttt gga gcg ggg ctg 719 
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu 
225 230 235 

ggc ate acg eta tac ggc atg gca tat atg ttt gta cac gat ggc ctg 767 
Gly lie Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu 
240 245 250 255 

gtg cac agg cgc ttt ccc ace ggg ccc ate get ggc ctg ccc tac atg 815 
Val His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met 
260 265 270 

aag cgc ctg aca gtg gec cac cag eta cac cac age ggc aag tac ggt 863 
Lys Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly 
275 280 285 

ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att 911 
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie 
290 295 300 

cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg 959 
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp 
305 310 315 

tec aag egg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg 1011 

Ser Lys Arg 

320 

tgataaggtg tggctagagc gatgcgtgtg agaegggtat gtcaeggteg actggtctga 1071 

tggccaatgg catcggccat gtctggtcat caegggctgg ttgcctgggt gaaggtgatg 1131 

cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc 1191 
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caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc 1251 

catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta 1311 

gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg 1371 

catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc 1431 

agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga 1491 

ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga 1551 

tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa 1608 

<210> 32 
<211> 322 
<212> PRT 

<213> Haematococcus pluvialis 
<400> 32 

Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His lie Gly 
15 10 15 



Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser 
20 25 30 

Lys Leu Gin Ser lie Ser Val Lys Ala Arg Arg Val Glii Leu Ala Arg 
35 40 45 



Asp lie Thr Arg Pro Lys Val Cys Leu His Ala Gin Arg Cys Ser Leu 
50 55 60 



Val Arg Leu Arg Val Ala Ala Pro Gin Thr Glu Glu Ala Leu Gly Thr 
65 70 75 80 
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Val Gin Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu 
85 90 95 



Gin Gin Leu Asp Arg Ala lie Ala Glu Arg Arg Ala Arg Arg Lys Arg 
100 105 , 110 



Glu Gin Leu Ser Tyr Gin Ala Ala Ala He Ala Ala Ser He Gly Val 
115 120 125 



Ser Gly He Ala He Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met 
130 135 140 



Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu 
145 150 155 160 



Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala 
165 170 175 



His Lys Ala He Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys 
180 185 190 



Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe 
195 200 205 



Ala He He Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe 
210 215 220 



Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly 
225 230 235 240 



He Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val 
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245 250 255 

His Arg Arg Phe Pro Thr Gly Pro lie Ala Gly Leu Pro Tyr Met Lys 
260 265 270 

Arg Leu Thr Val Ala His Gin Leu His His Ser Gly Lys Tyr Gly Gly 
275 280 285 

Ala Pro Trp Gly Met Phe Leu Gly Pro Gin Glu Leu Gin His lie Pro 
290 295 300 



Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser 
305 310 315 320 



Lys Arg 



<210> 33 

<211> 528 

<212> DNA 

<213> Erwinia uredovora 
<220> 

<221> CDS 

<222> (1)..(528) 

<400> 33 

atg ttg tgg att tgg aat gcc ctg ate gtt ttc gtt acc gtg att ggc 48 
Met Leu Trp lie Trp Asn Ala Leu He Val Phe Val Thr Val He Gly 
15 10 15 



atg gaa gtg att get gca ctg gca cac aaa tac ate atg cac ggc tgg 
Met Glu Val He Ala Ala Leu Ala His Lys Tyr He Met His Gly Trp 
20 25 30 



96 
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ggt tgg gga tgg cat ctt tea cat cat gaa ccg cgt aaa ggt gcg ttt 144 
Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 



gaa gtt aac gat ctt tat gec gtg gtt ttt get gca tta teg ate ctg 192 
Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser lie Leu 
50 55 60 



240 



ctg att tat ctg ggc agt aca gga atg tgg ccg etc cag tgg att ggc 
Leu He Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp He Gly 
65 70 75 80 



gca ggt atg acg gcg tat gga tta etc tat ttt atg gtg cac gac ggg 288 
Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 

ctg gtg cat caa cgt tgg cca ttc cgc tat att cca cgc aag ggc tac 336 

Leu Val His Gin Arg Trp Pro Phe Arg Tyr He Pro Arg Lys Gly Tyr 
100 105 110 

etc aaa egg ttg tat atg gcg cac cgt atg cat cac gee gtc agg ggc 384 

Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 

aaa gaa ggt tgt gtt tct ttt ggc ttc etc tat gcg ccg ccc ctg tea 432 

Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 

130 135 140 

aaa ctt cag gcg acg etc egg gaa aga cat ggc get aga gcg ggc get 480 

Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 

gee aga gat gcg cag ggc ggg gag gat gag, ccc gca tec ggg aag taa 528 

Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 34 

<211> 175 

<212> PRT 

<213> Erwinia uredovora 
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<400> 34 

Met Leu Trp He Trp Asn Ala Leu He Val Phe Val Thx Val He Gly 
15 10 15 



Met Glu Val He Ala Ala Leu Ala His Lys Tyr He Met His Gly Trp 
20 25 30 



Gly Trp Gly Trp His Leu Ser His His Glu Pro Arg Lys Gly Ala Phe 
35 40 45 



Glu Val Asn Asp Leu Tyr Ala Val Val Phe Ala Ala Leu Ser He Leu 
50 55 60 



Leu He Tyr Leu Gly Ser Thr Gly Met Trp Pro Leu Gin Trp He Gly 
65 70 75 80 



Ala Gly Met Thr Ala Tyr Gly Leu Leu Tyr Phe Met Val His Asp Gly 
85 90 95 



Leu Val His Gin Arg Trp Pro Phe Arg Tyr He Pro Arg Lys Gly Tyr 
100 105 110 



Leu Lys Arg Leu Tyr Met Ala His Arg Met His His Ala Val Arg Gly 
115 120 125 



Lys Glu Gly Cys Val Ser Phe Gly Phe Leu Tyr Ala Pro Pro Leu Ser 
130 135 140 



Lys Leu Gin Ala Thr Leu Arg Glu Arg His Gly Ala Arg Ala Gly Ala 
145 150 155 160 
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Ala Arg Asp Ala Gin Gly Gly Glu Asp Glu Pro Ala Ser Gly Lys 
165 170 175 



<210> 35 

<211> 1520 

<212> DNA 

<213> Artificial 

<220> 

<223> Promotor 



<400> 35 

ctcgagtacc gaggcggaac ggcaggaatg tttccctctc ttttagaggg caattcttta 60 

tccaatgtca tgttgatgct agatatttct gtctcttata ataaggcgaa tacccatttt 120 

tgaattgaag ttgagataaa aaaaaagggg gcccaatttg tcaacgccaa agagtcaagc 180 

tttttctttg gctttagccg aacaatctaa gacttattgt ttttgaagat atttgacctt 240 

ttctagatat tccttcaagt aaagcttttt tcgagttttt tttttttttc tttgtgaagg 300 

atttattgtt attggtatcc attttttatt ggaagacaag ataagttaat attgattttg 360 

cttaaagatt aaaaggaaat cagaaaacga caataaaaaa tgtaacggac aaactatggt 420 

gtcgattata agtctaaatc cttaaaaaat gacaacgagt tgctttcctc tgaaaacaat 480 

tcttttgtct ttgcaagaaa ggtttctttt ttgtttgctt gcattactta aacatcaaat 540 

caaatgaaag gaataaagca gatttgaggg cgaataagga ttttctggtc aacaagatgt 600 

gagtgacacc taaggaacta aatgccattc atttgtttta aaacgacatc aaagattgat 660 

gatcaacagg attgagagag agaaaaagaa ctcgtgtcat ttatttctgt tgactgaaat 720 

tttatattta gaaaaaatgt caaatctata gctttagcta tattacataa catttgaaat 780 

aataataata aaaaaagaca cattagagac acttttcaaa ctctaaataa ctgtctataa 840 
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acacaaagaa aacaaagacc tctataacaa cttattagat ttttctcgta cttttgtcta 900 

aagatgatgt attcttgtta tcccacactt ctttcatttg ttcttgatgc tactaaatat 960 

acaaaatttc ttttttgcaa gagatattat tccaaaaatt ttcaaaaaga aatttttttc 1020 

acaatagcag ttgatcgtgt aacccaaaga ggttctttgt tattttgcac ttccgctttg 1080 

cggtgatgca tattcaaagt aatatatgga ataaacaacg tgtttaagca tgaaagaaag 1140 

gaaacaaagg ccgctttgaa caaatgcata atatttcaga caaaaatgat ctaaagcaag 1200 

cagtaaatca aacaagaaac attgctgatt cgcgttagaa aacgataaaa gtctaataag 1260 

ccactaagta tacttcaatg aactttttgt atgcttatgg tccaatcaga ccaataattt 1320 

gtgaccattc ctgaggtggc tttggtgatg cggaaacaga aaaaaatttt ctcaccaatc 1380 

gatttaaaaa acaatttctg ctttgaacca aaactttttt tttctcttta atcattaact 1440 

ttatcaagta tgtacctacc ctcaaagtcc tcactcaagc acaattatgc taacattgtt 1500 

ccaccttctc tttagaaatg 1520 

<210> 36 

<211> 16245 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 
<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 
<222> (10472) . . (10472) 
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<223> n is a, c, g, or t 
<220> 

<221> misc_jE eature 
<222> (10563) . . (10563) 
<223> n is a, c, g, or t 

<400> 36 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 
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acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 
acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 
agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
agctccaccg. attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
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taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagafctat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 
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gcgtgcaact ggctccccct gccctgcccg 
gtctcgaaca ggaggcggca ggtttggcga 
tgacgaccaa gaagcgaaaa accgccggcg 
agcaggccgc gttgctgaaa cacacgaagc 
tcgatattgc gccgtggccg gacacgatgc 
ccctgttcac cacgcgcaac aagaaaatcc 
tccacgtcaa caaggacgtg aagatcacct 
acgaactggt gtggcagcag gtgttggagt 
tcaccttcac gttctacgag ctttgccagg 
acacgaaggc cgaggaatgc ctgtcgcgcc 
accgcgttgg gcacctggaa tcggtgtcgc 
gcaagaaaac gtcccgttgc caggtcctga 
gcgaccacta cacgaaattc atatgggaga 
ggatgttcga ctatttcagc tcgcaccggg 
gcctcatgtg cggatcggat tccacccgcg 
cctgcgaaga gttgcgaggc agcggcctgg 
tgcattgcaa acgctagggc cttgtggggt 
ctttactggc atttcaggaa caagcgggca 
gctcgggacg cacggcgcgc tctacgaact 
tgtgattaag gctcagattc gacggcttgg 
ccgattgtcg gccctgaaga aagctccaga 
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cgccatcggc cgccgtggag cgttcgcgtc 3600 

agtcgatgac catcgacacg cgaggaacta 3660 

aggacctggc aaaacaggtc agcgaggcca 3720 

agcagatcaa ggaaatgcag ctttccttgt 3780 

gagcgatgcc aaacgacacg gcccgctctg 3840 

cgcgcgaggc gctgcaaaac aaggtcattt 3900 

acaccggcgt cgagctgcgg gccgacgatg 3960 

acgcgaagcg cacccctatc ggcgagccga 4020 

acctgggctg gtcgatcaat ggccggtatt 4080 

tacaggcgac ggcgatgggc ttcacgtccg 4140 

tgctgcaccg cttccgcgtc ctggaccgtg 4200 

tcgacgagga aatcgtcgtg ctgtttgctg 4260 

agtaccgcaa gctgtcgccg acggcccgac 4320 

agccgtaccc gctcaagctg gaaaccttcc 43 80 

tgaagaagtg gcgcgagcag gtcggcgaag 4440 

tggaacacgc ctgggtcaat gatgacctgg 4500 

cagttccggc tgggggttca gcagccagcg 4560 

ctgctcgacg cacttgcttc gctcagtatc 4620 

gccgataaac agaggattaa aattgacaat 4680 

agcggccgac gtgcaggatt tccgcgagat 4740 

gatgttcggg tccgtttacg agcacgagga 4800 
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gaaaaagccc atggaggcgt tcgctgaacg 
catcgacggc gagatcattg ggctgtcggt 
tcacaaggcg catctgtccg gcgttttcgt 
cggtatgctg ctgcgggcgt tgccggcggg 
tccaacggga atctggtgga tgcgcatctt 
ctggagcttg ttgtttattt cggtctaccg 
cgctgtgcag ccgctgatgg tcgtgttcat 
attgatggcg gtcctggggg ctatttgcgg 
accaaacgca gcgctagatc ctgtcggcgt 
ggcgttcgga accgtgctga cccgcaagtg 
cgcctggcaa ctggcggccg gaggacttct 
gccaatcccg atgcctacag gaaccaatgt 
agcgggttta acctacttcc tttggttccg 
ttccttactg ggctttctca gccccagatc 
cgacagtcgg aacttcgggt ccccgacctg 
tgatatcgtc aacgttcact tctaaagaaa 
tccagcgatt tcctattatg tcggcatagt 
cgagaaatga ataagaaggc tgataattcg 
caggcagcaa cgctctgtca tcgttacaat 
gtttcaaacc cggcagctta gttgccgttc 
tctgccgcct tacaacggct ctcccgctga 
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gttgcgagat gccgtggcat tcggcgccta 4860 

cttcaaacag gaggacggcc ccaaggacgc 4920 

ggagcccgaa cagcgaggcc gaggggtcgc 4980 

tttattgctc gtgatgatcg tccgacagat 5040 

catcctcggc gcacttaata tttcgctatt 5100 

cctgccgggc ggggtcgcgg cgacggtagg 5160 

ctctgccgct ctgctaggta gcccgatacg 522 0 

aactgcgggc gtggcgctgt tggtgttgac 5280 

cgcagcgggc ctggcggggg cggtttccat 5340 

gcaacctccc gtgcctctgc tcacctttac 5400 

gctcgttcca gtagctttag tgtttgatcc 5460 

tctcggcctg gcgtggctcg gcctgatcgg 5520 

ggggatctcg cgactcgaac ctacagttgt 5580 

tggggtcgat cagccgggga tgcatcaggc 5640 

taccattcgg tgagcaatgg ataggggagt 5700 

tagcgccact cagcttcctc agcggcttta 5760 

tctcaagatc gacagcctgt cacggttaag 5820 

gatctctgcg agggagatga tatttgatca 5880 

caacatgcta ccctccgcga gatcatccgt 5940 

ttccgaatag catcggtaac atgagcaaag 6000 

cgccgtcccg gactgatggg ctgcctgtat 6060 
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cgagtggtga ttttgtgccg agctgccggt 
tatattgtgg tgtaaacaaa ttgacgctta 
taatgtactg gggtggtttt tcttttcacc 
accgcctggc cctgagagag ttgcagcaag 
aaatcctgtt tgatggtggt tccgaaatcg 
ccgagatagg gttgagtgtt gttccagttt 
actccaacgt caaagggcga aaaaccgtct 
cacccaaatc aagttttttg gggtcgaggt 
ggagcccccg atttagagct tgacggggaa 
agaaagcgaa aggagcgggc gccattcagg 
cgggcctctt cgctattacg ccagctggcg 
tgggtaacgc cagggttttc ccagtcacga 
ctcggtaccc ggggatcttt cgacactgaa 
cgaggagcct cgtcctgtca caactaccaa 
gctcattaag agccagttca tgggcgttgg 
gtacaccaac gctcttctga tccagtcgat 
aagatccacg tcttcgggaa gccagcgact 
aacagctttc tcagccaggg ccagcccaag 
aagaactgga ggggtggtgt caaggaggag 
cggtgtcaag aggatattct tcgactctgt 
tagcatagct tcatttggat ttgctttcca 
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cggggagctg ttggctggct ggtggcagga 6120 

gacaacttaa taacacattg cggacgtttt 6180 

agtgagacgg gcaacagctg attgcccttc 6240 

cggtccacgc tggtttgccc cagcaggcga 6300 

gcaaaatccc ttataaatca aaagaatagc 6360 

ggaacaagag tccactatta aagaacgtgg 6420 

atcagggcga tggcccacta cgtgaaccat 6480 

gccgtaaagc actaaatcgg aaccctaaag 6540 

agccggcgaa cgtggcgaga aaggaaggga 6600 

ctgcgcaact gttgggaagg gcgatcggtg 6660 

aaagggggat gtgctgcaag gcgattaagt 6720 

cgttgtaaaa cgacggccag tgaattcgag 6780 

atacgtcgag cctgctccgc ttggaagcgg 6840 

catggagtac gataagggcc agttccgcca 6900 

catgatggcc gtcatgcatc tgtacttcaa 6960 

catccgctga aggcgctttc gaatctggtt 7 020 

ggtgacctcc agcgtccctt taaggctgcc 7080 

accgacaagg cctccctcca gaacgccgag 7140 

taagctcctt attgaagtcg gaggacggag 7200 

attatagata agatgatgag gaattggagg 7260 

ggctgagact ctagcttgga gcatagaggg 7320 



WO 2004/063359 
tcctttggct ttcaatattc tcaagtatct 
tattcaccaa tgagcattgg aatgaacatg 
tcgaaataca tccggatgtc gaaggcttgg 
gcactattga tcatccgata gctctgcaaa 
tagcagttcc aggtggaatg ttatgatgag 
tctctagtta gctcaccaca aaagtcagac 
gtaaggattt cggcacggct acggaagacg 
atttaattct atttgtgttt gatcgagacc 
cgtatagcta ccagtgagga agtggactca 
ctttaagcct aaactataca gaataagata 
tgtccagatc atggttgacc ggtgcctgga 
cctagctgat tctggagtga cccagagggt 
accatttgta gaaaaatgtg acgaactcgt 
tggcatgcgg agagacggac ggacgcagag 
acagctctgg cggctctgag gtgcagtgga 
cgccccgaag tggaaaggct ggtgtgcccc 
agaatatgga gcttcatcga atcaccggca 
gtatagccgt cggcgaaata gcatgccatt 
atctggtaaa agattcacga gatagtacct 
gcgtaagctc cctaattggc ccatccggca 
ctgctttgcc cggtgtatga aaccggaaag 
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cgagtttgaa cttattccct gtgaaccttt 73 80 

aatctgagga ctgcaatcgc catgaggttt 7440 

ggcacctgcg ttggttgaat ttagaacgtg 7500 

gggcgttgca caatgcaagfc caaacgttgc 7560 

cattgtatta aatcaggaga tatagcatga 7620 

ggcgtaacca aaagtcacac aacacaagct 7680 

gagaagccac cttcagtgga ctcgagtacc 7740 

taatacagcc cctacaacga ccatcaaagt 7800 

aatcgacttc agcaacatct cctggataaa 7860 

ggtggagagc ttataccgag ctcccaaatc 7920 

tcttcctata gaatcatcct tattcgttga 7980 

catgacttga gcctaaaatc cgccgcctcc 8040 

gagctctgta cagtgaccgg tgactctttc 8100 

agaagggctg agtaataagc cactggccag 8160 

tgattattaa tccgggaccg gccgcccctc 8220 

tcgttgacca agaatctatt gcatcatcgg 8280 

gtaagcgaag gagaatgtga agccaggggt 8340 

aacctaggta cagaagtcca attgcttccg 8400 

tctccgaagt aggtagagcg agtacccggc 8460 

tctgtagggc gtccaaatat cgtgcctctc 8520 

gccgctcagg agctggccag cggcgcagac 8580 
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cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 . 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 



WO 2004/063359 
ccgatccgga gccgggactg tcgggcgtac 
gaccgatggc tgtgtagaag tactcgccga 
gagggcaaag gaatagagta gatgccgacc 
tcatcaaaca gcttgacgaa tctggatata 
ttgagacaaa tggtgttcag gatctcgata 
gtgccttcta gtgatttaat agctccatgt 
cctcttccag atacagctca tctgcaatgc 
cttncaggct ccggcgaaga gaagaatagc 
gagatcaagc agatcaacgg tcgtcaagag 
tccacgcgac tatatatttg tctctaattg 
atagcttgac tatgaaaatt ccgtcaccag 
tcttccttga actctcaagc ctacaggaca 
canttcctac taagatggta tacaatagta 
taacacccaa tacgccggcc gaaacttttt 
atgcacaggt acacttgttt agaggtaatc 
gtgtaagcgc ccactccaca tctccactcg 
atgctccata gactcacatt gatattgtcg 
tacaaaagtt agcagagaag catgatttct 
tcggtatgtg aattctatct attttttttc 
ttcttaggta atactgtcaa gcatcaatat 
tctcatatta ctaatgctca cacagttcct 
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acaaatcgcc cgcagaagcg cggccgtctg 9900 
tagtggaaac cgacgcccca gcactcgtcc 9960 

gcgggatcga tccacttaac gttactgaaa 10020 

agatcgttgg tgtcgatgtc agctccggag 10080 

agatacgttc atttgtccaa gcagcaaaga 10140 

caacaagaat aaaacgcgtt ttcgggttta 10200 

attaatgcat tgactgcaac ctagtaacgc 10260 

ttagcagagc tattttcatt ttcgggagac 10320 

acctacgaga ctgaggaatc cgctcttggc 10380 

tactttgaca tgctcctctt ctttactctg 10440 

cncctgggtt cgcaaagata attgcatgtt 10500 

cacattcatc gtaggtataa acctcgaaat 10560 

accatgcatg gttgcctagt gaatgctccg 10620 

tacaactctc ctatgagtcg tttacccaga 10680 

cttctttcta gctagaagtc ctcgtgtact 10740 

acctgcaggc atgcaagctt aatctataca 10800 

aagatttcga tgctgactta gtagagcaac 10860 

taatctttga agaccgcaag tttgcagata 10920 

tgatgtgtgc atggatgact catgatcata 10980 

ggcaagggcg tttacaagat tgcttcttgg 11040 

ggagaaggta ttatcaaggg acttgccgaa 11100 . 
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gtcggcctcc ctcttggtcg tggcttgctt 
ttaactaagg gtatttacac tgccgaatct 
gtttttggct ttattgcaca acacaaaatg 
atgtcgcctg aagcttggcg taatcatggt 
cgctcacaat tccacacaac atacgagccg 
aatgagtgag ctaactcaca ttaattgcgt 
acctgtcgtg ccagctgcat taatgaatcg 
ttgggccaaa gacaaaaggg cgacattcaa 
ggaaattatt cattaaaggt gaattatcac 
agccagcaaa atcaccagta gcaccattac 
aaccatcgat agcagcaccg taatcagtag 
actgtagcgc gttttcatcg gcattttcgg 
tttcataatc aaaatcaccg gaaccagagc 
caccctcaga accgccaccc tcagagccac 
cagagccgcc gccagcattg acaggaggcc 
gataatttat cctagtttgc gcgctatatt 
tgcgggactc taatcataaa aacccatctc 
attacatgct taacgtaatt caacagaaat 
ggattcaatc ttaagaaact ttattgccaa 
tgtggcggga actccacgaa aatatccgaa 
ttgcctgggc agtcgccgcc gacgccgttg 
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ttgctagcag aaatgtcatc tcaaggtgca 11160 

gtcaatatgg ctcgccgcaa caaagatttc 11220 

aatcagtatg atgatgagga ttttgttgtc 11280 

catagctgtt tcctgtgtga aattgttatc 11340 

gaagcataaa gtgtaaagcc tggggtgcct 11400 

tgcgctcact gcccgctttc cagtcgggaa 11460 

gccaacgcgc ggggagaggc ggtttgcgta 11520 

ccgattgagg gagggaaggt aaatattgac 11580 

cgtcaccgac ttgagccatt tgggaattag 11640 

cattagcaag gccggaaacg tcaccaatga 11700 

cgacagaatc aagtttgcct ttagcgtcag 11760 

tcatagcccc cttattagcg tttgccatct 11820 

caccaccgga accgcctccc tcagagccgc 11880 

caccctcaga gccgccacca gaaccaccac 11940 

cgatctagta acatagatga caccgcgcgc 12000 

ttgttttcta tcgcgtatta aatgtataat 12 060 

ataaataacg tcatgcatta catgttaatt 12120 

tatatgataa tcatcgcaag accggcaaca 12180 

atgtttgaac gatcggggat catccgggtc 12240 

cgcagcaaga tatcgcggtg catctcggtc 12300 

atgtggacgc cgggcccgat catattgtcg 12360 
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ctcaggatcg tggcgttgtg cttgtcggcc gttgctgtcg taatgatatc ggcaccttcg 12420 
accgcctgtt ccgcagagat cccgtgggcg aagaactcca gcatgagatc cccgcgctgg 12480 
aggatcatcc agccggcgtc ccggaaaacg attccgaagc ccaacctttc atagaaggcg 12540 
gcggtggaat cgaaatctcg tgatggcagg ttgggcgtcg cttggtcggt catttcgaac 12600 
cccagagtcc cgctcagaag aactcgtcaa gaaggcgata gaaggcgatg cgctgcgaat 12660 
cgggagcggc gataccgtaa agcacgagga agcggtcagc ccattcgccg ccaagctctt 12720 
cagcaatatc acgggtagcc aacgctatgt cctgatagcg gtccgccaca cccagccggc 12780 
cacagtcgat gaatccagaa aagcggccat tttccaccat gatattcggc aagcaggcat 12840 
cgccatgggt cacgacgaga tcatcgccgt cgggcatgcg cgccttgagc ctggcgaaca 12900 
gttcggctgg cgcgagcccc tgatgctctt cgtccagatc atcctgatcg acaagaccgg 12960 
cttccatccg agtacgtgct cgctcgatgc gatgtttcgc ttggtggtcg aatgggcagg 13020 
tagccggatc aagcgtatgc agccgccgca ttgcatcagc catgatggat actttctcgg 13080 
caggagcaag gtgagatgac aggagatcct gccccggcac ttcgcccaat agcagccagt 13140 
cccttcccgc ttcagtgaca acgtcgagca cagctgcgca aggaacgccc gtcgtggcca 13200 
gccacgatag ccgcgctgcc tcgtcctgca gttcattcag ggcaccggac aggtcggtct 13260 
tgacaaaaag aaccgggcgc ccctgcgctg acagccggaa cacggcggca tcagagcagc 13320 
cgattgtctg ttgtgcccag tcatagccga atagcctctc cacccaagcg gccggagaac 13380 
ctgcgtgcaa tccatcttgt tcaatcatgc gaaacgatcc agatccggtg cagattattt 13440 
ggattgagag tgaatatgag actctaattg gataccgagg ggaatttatg gaacgtcagt 13500 
ggagcatttt tgacaagaaa tatttgctag ctgatagtga ccttaggcga cttttgaacg 13560 
cgcaataatg gtttctgacg tatgtgctta gctcattaaa ctccagaaac ccgcggctga 13620 



WO 2004/063359 
gtggctcctt caacgttgcg gttctgtcag 
atcggcgggg gtcataacgt gactccctta 
ccgccttcag tttaaactat cagtgtttga 
aaagagcgtt tattagaata atcggatatt 
tccatttgta tgtgcatgcc aaccacaggg 
gagcaagatt ggccgccgcc cgaaacgatc 
aaattgcacc aacgcataca gcgccagcag 
gtgaaccaga tcgcgcagga ggcccggcag 
gtcgagcgcg acagtgctca gaattacgat 
ccggaccagc ctccgctggt ccgattgaac 
ggacatatta tgtttatcag tgataaagtg 
gtgatccgtg ccgccctgga cctgttgaac 
aaactggcgg aacggttggg ggttcagcag 
cgggcgctgc tcgacgcact ggccgaagcc 
ccgagagccg acgacgactg gcgctcattt 
gcgctgctcg cctaccgcga tggcgcgcgc 
cagatggaaa cggccgacgc gcagcttcgc 
gacgccgtca atgcgctgat gacaatcagc 
caggccggcg acagcgatgc cggcgagcgc 
ccgctgttgc gggccgcgat agacgccttc 
cagggactcg cggtgattgt cgatggattg 
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ttccaaacgt aaaacggctt gtcccgcgtc 13680 

attctccgct catgatcaga ttgtcgtttc 13740 

caggatatat tggcgggtaa acctaagaga 13800 

taaaagggcg tgaaaaggtt tatccgttcg 13860 

ttccccagat ctggcgccgg ccagcgagac 13920 

cgacagcgcg cccagcacag gtgcgcaggc 13980 

aatgccatag tgggcggtga cgtcgttcga 14040 

caccggcata atcaggccga tgccgacagc 14100 

caggggtatg ttgggtttca cgtctggcct 14160 

gcgcggattc tttatcactg ataagttggt 14220 

tcaagcatga caaagttgca gccgaataca 14280 

gaggtcggcg tagacggtct gacgacacgc 14340 

ccggcgcttt actggcactt caggaacaag 14400 

atgctggcgg agaatcatac gcattcggtg 14460 

ctgatcggga atgcccgcag cttcaggcag 14520 

atccatgccg gcacgcgacc gggcgcaccg 14580 

ttcctctgcg aggcgggttt ttcggccggg 14640 

tacttcactg ttggggccgt gcttgaggag 14700 

ggcggcaccg ttgaacaggc tccgctctcg 14760 

gacgaagccg gtccggacgc agcgttcgag 14820 

gcgaaaagga ggctcgttgt caggaacgtt 14880 
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gaaggaccga gaaagggtga cgattgatca 
acagcagagc catgtagaca acatcccctc 
agcccgctac gggctttttc atgccctgcc 
cctctctggc ggccttctgg cgctcttccg 
tcgttcggct gcggcgagcg gtatcagctc 
aatcagggga taacgcagga aagaacatgt 
gtaaaaaggc cgcgttgctg gcgtttttcc 
aaaatcgacg ctcaagtcag aggtggcgaa 
ttccccctgg aagctccctc gtgcgctctc 
tgtccgcctt tctcccttcg ggaagcgtgg 
gtcattatag cgattttttc ggtatatcca 
caaagggttc gtgtagactt tccttggtgt 
gaagtaggcc cacccgcgag cgggtgttcc 
gtgctcaacg ggaatcctgc tctgcgaggc 
ggcaagcgga tggctgatga aaccaagcca 
tactgccttc cagacgaacg aagagcgatt 
ctgtcggcct acctgctggc cgtcggccag 
gagcacgtcc gcgagctggc ccgcatcaat 
aaactctggc tcaccgacga cccgcgcacg 
ctgctggcga agatcgaaga gaagcaggac 
cgcccgaggg cagagccatg acttttttag 
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ggaccgctgc cggagcgcaa cccactcact 14940 

cccctttcca ccgcgtcaga cgcccgtagc 15000 

ctagcgtcca agcctcacgg ccgcgctcgg 15060 

cttcctcgct cactgactcg ctgcgctcgg 15120 

actcaaaggc ggtaatacgg ttatccacag 15180 

gagcaaaagg ccagcaaaag gccaggaacc 15240 

ataggctccg cccccctgac gagcatcaca 15300 

acccgacagg actataaaga taccaggcgt 15360 

ctgttccgac cctgccgctt accggatacc 15420 

cgcttttccg ctgcataacc ctgcttcggg 15480 

tcctttttcg cacgatatac aggattttgc 15540 

atccaacggc gtcagccggg caggataggt 15600 

ttcttcactg tcccttattc gcacctggcg 15660 

tggccggcta ccgccggcgt aacagatgag 15720 

accaggaagg gcagcccacc tatcaaggtg 15780 

gaggaaaagg cggcggcggc cggcatgagc 15840 

ggctacaaaa tcacgggcgt cgtggactat 15900 

ggcgacctgg gccgcctggg cggcctgctg 15960 

gcgcggttcg gtgatgccac gatcctcgcc 16020 

gagcttggca aggtcatgat gggcgtggtc 16080 

ccgctaaaac ggccgggggg tgcgcgtgat 16140 
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tgccaagcac gtccccatgc gctccatcaa gaagagcgac ttcgcggagc tggtgaagta 16200 
catcaccgac gagcaaggca agaccgagcg cctttgcgac gctca 16245 

<210> 37 

<211> 17877 

<212> DNA 

<213> Artificial 

<220> 

<223> Promotor 
<220> 

<221> mis cofeature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> mi sc_f eature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 37 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 



caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 



360 



WO 2004/063359 
gaggggcgcg atccttgaca cttgaggggc 
tgacatttga ggggctgtcc acaggcagaa 
ttttcggcca ccgctaacct gtcttttaac 
tttttaacca gggctgcgcc ctgtgcgcgt 
cttctcgaac cctcccggcc cgctaacgcg 
tcggccgcga acggcctcac cccaaaaatg 
atcggggcag taacgggatg ggcgatcagc 
ccgcaggtgc tggcatcgac attcagcgac 
ggtggcggcc tgcccttcac ttcggccgtc 
gcaattttta ccttgggcat tcttggcata 
ggtgcgataa acccagcgaa ccatttgagg 
acgagaattg gacctttaca gaattactct 
acgaagagga tgaagaggat gaggaggcag 
agataatata tcttttatat agaagatatc 
ataggcagcg cgcttatcaa tatatctata 
ctaatgcttg aaacccagga caataacctt 
atgactccaa cttattgata gtgttttatg 
agctccaccg attttgagaa cgacagcgac 
agattcaggt tatgccgctc aattcgctgc 
cccttcaggc gggattcata cagcggccag 
ggtgacagca ggctcataag acgccccagc 
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agagtgctga cagatgaggg gcgcacctat 420 
aatccagcat ttgcaagggt ttccgcccgt 480 
ctgcttttaa accaatattt ataaaccttg 540 
gaccgcgcac gccgaagggg ggtgcccccc 600 

ggcctcccat ccccccaggg gctgcgcccc 660 

gcagcgctgg cagtccttgc cattgccggg 720 

ccgagcgcga cgcccggaag cattgacgtg 780 

caggtgccgg gcagtgaggg cggcggcctg 840 

ggggcattca cggacttcat ggcggggccg 900 

gtggtcgcgg gtgccgtgct cgtgttcggg 960 

tgataggtaa gattataccg aggtatgaaa 1020 

atgaagcgcc atatttaaaa agctaccaag 1080 

attgccttga atatattgac aatactgata 1140 

gccgtatgta aggatttcag ggggcaaggc 1200 

gaatgggcaa agcataaaaa cttgcatgga 1260 

atagcttgta aattctatca taattgggta 132 0 

ttcagataat gcccgatgac tttgtcatgc 1380 

ttccgtccca gccgtgccag gtgctgcctc 1440 

gtatatcgct tgctgattac gtgcagcttt 1500 

ccatccgtca tccatatcac cacgtcaaag 1560 

gtcgccatag tgcgttcacc gaatacgtgc 1620 
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gcaacaaccg tcttccggag actgtcatac 
gccccgacat agccccactg ttcgtccatt 
tgtatgcgcg aggttaccga ctgcggcctg 
ggccaacgcc cataatgcgg gctgttgccc 
tgattttctg gtgcgtaccg ggttgagaag 
tacggcagtg agagcagaga tagcgctgat 
ccccgtcagt agctgaacag gagggacagc 

aaaaacacca tcatacacta aatcagtaag 
aaatcggctc cgtcgatact atgttatacg 
ttttctggta tttaaggttt tagaatgcaa 
aattagcttc ttggggtatc tttaaatact 
taaaatgaga atatcaccgg aattgaaaaa 
tacggaagga atgtctcctg ctaaggtata 
tttaaaaatg acggacagcc ggtataaagg 
catgatgcta tggctggaag gaaagctgcc 
tgatggctgg agcaatctgc tcatgagtga 
tgaagatgaa caaagccctg aaaagattat 
tcactccatc gacatatcgg attgtcccta 
attggattac ttactgaata acgatctggc 
cactccattt aaagatccgc gcgagctgta 
ggaacttgtc ttttcccacg gcgacctggg 
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gcgtaaaaca gccagcgctg gcgcgattta 1680 

tccgcgcaga cgatgacgtc actgcccggc 1740 

agttttttaa gtgacgtaaa atcgtgttga 1800 

ggcatccaac gccattcatg gccatatcaa 1860 

cggtgtaagt gaactgcagt tgccatgttt 1920 

gtccggcggt gcttttgccg ttacgcacca 1980 

tgatagacac agaagccact ggagcacctc 2040 

ttggcagcat cacccataat tgtggtttca 2100 

ccaactttga aaacaacttt gaaaaagctg 2160 

ggaacagtga attggagttc gtcttgttat 2220 

gtagaaaaga ggaaggaaat aataaatggc 2280 

actgatcgaa aaataccgct gcgtaaaaga 2340 

taagctggtg ggagaaaatg aaaacctata 2400 

gaccacctat gatgtggaac gggaaaagga 2460 

tgttccaaag gtcctgcact ttgaacggca 2520 

ggccgatggc gtcctttgct cggaagagta 2580 

cgagctgtat gcggagtgca tcaggctctt 2640 

tacgaatagc ttagacagcc gcttagccga 2700 

cgatgtggat tgcgaaaact gggaagaaga 2760 

tgatttttta aagacggaaa agcccgaaga 2820 

agacagcaac atctttgtga aagatggcaa 2880 
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agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 31-80 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
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accgcgttgg gcacctggaa tcggtgtcgc 
gcaagaaaac gtcccgttgc caggtcctga 
gcgaccacta cacgaaattc atatgggaga 
ggatgttcga ctatttcagc tcgcaccggg 
gcctcatgtg cggatcggat tccacccgcg 
cctgcgaaga gttgcgaggc agcggcctgg 
tgcattgcaa acgctagggc cttgtggggt 
ctttactggc atttcaggaa caagcgggca 
gctcgggacg cacggcgcgc tctacgaact 
tgtgattaag gctcagattc gacggcttgg 
ccgattgtcg gccctgaaga aagctccaga 
gaaaaagccc atggaggcgt tcgctgaacg 
catcgacggc gagatcattg ggctgtcggt 
tcacaaggcg catctgtccg gcgttttcgt 
cggtatgctg ctgcgggcgt tgccggcggg 
tccaacggga atctggtgga tgcgcatctt 
ctggagcttg ttgtttattt cggtctaccg 
cgctgtgcag ccgctgatgg tcgtgttcat 
attgatggcg gtcctggggg ctatttgcgg 
accaaacgca gcgctagatc ctgtcggcgt 
ggcgttcgga accgtgctga cccgcaagtg 



PO7EP2004/000099 

99/357 

tgctgcaccg cttccgcgtc ctggaccgtg 4200 

tcgacgagga aatcgtcgtg ctgtttgctg 4260 

agtaccgcaa gctgtcgccg acggcccgac 4320 

agccgtaccc gctcaagctg gaaaccttcc 4380 

tgaagaagtg gcgcgagcag gtcggcgaag 4440 

tggaacacgc ctgggtcaat gatgacctgg 4500 

cagttccggc tgggggttca gcagccagcg 4560 

ctgctcgacg cacttgcttc gctcagtatc 4620 

gccgataaac agaggattaa aattgacaat 4680 

agcggccgac gtgcaggatt tccgcgagat 4740 

gatgttcggg tccgtttacg agcacgagga 4800 

gttgcgagat gccgtggcat tcggcgccta 4860 

cttcaaacag gaggacggcc ccaaggacgc 4920 

ggagcccgaa cagcgaggcc gaggggtcgc 4980 

tttattgctc gtgatgatcg tccgacagat 5040 

catcctcggc gcacttaata tttcgctatt 5100 

cctgccgggc ggggtcgcgg cgacggtagg 5160 

ctctgccgct ctgctaggta gcccgatacg 5220 

aactgcgggc gtggcgctgt tggtgttgac 5280 

cgcagcgggc ctggcggggg cggtttccat 5340 

gcaacctccc gtgcctctgc tcacctttac 5400 
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cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

. gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 552 0 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 582 0 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 



WO 2004/063359 

101/357 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact 
cgggcctctt cgctattacg ccagctggcg aaagggggat 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 
ctcggtaccc ggggatcttt cgacactgaa atacgtcgag 
cgaggagcct cgtcctgtca caactaccaa catggagtac 
gctcattaag agccagttca tgggcgttgg catgatggcc 
gtacaccaac gctcttctga tccagtcgat catccgctga 
aagatccacg tcttcgggaa gccagcgact ggtgacctcc 
aacagctttc tcagccaggg ccagcccaag accgacaagg 
aagaactgga ggggtggtgt caaggaggag taagctcctt 
cggtgtcaag aggatattct tcgactctgt attatagata 
tagcatagct tcatttggat ttgctttcca ggctgagact 
tcctttggct ttcaatattc tcaagtatct cgagtttgaa 
tattcaccaa tgagcattgg aatgaacatg aatctgagga 
tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg 
gcactattga tcatccgata gctctgcaaa gggcgttgca 
tagcagttcc aggtggaatg ttatgatgag cattgtatta 
tctctagtta gctcaccaca aaagtcagac ggcgtaacca 
gtaaggattt cggcacggct acggaagacg gagaagccac 
atttaattct atttgtgttt gatcgagacc taatacagcc 
cgtatagcta ccagtgagga agtggactca aatcgacttc 
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gttgggaagg gcgatcggtg 6660 

gtgctgcaag gcgattaagt 6720 

cgacggccag tgaattcgag 6780 

cctgctccgc ttggaagcgg 6840 

gataagggcc agttccgcca 6900 

gtcatgcatc tgtacttcaa 6960 

aggcgctttc gaatctggtt 7020 

agcgtccctt taaggctgcc 7080 

cctccctcca gaacgccgag 7140 

attgaagtcg gaggacggag 7200 

agatgatgag gaattggagg 7260 

ctagcttgga gcatagaggg 7320 

cttattccct gtgaaccttt 7380 

ctgcaatcgc catgaggttt 7440 

ttggttgaat ttagaacgtg 7500 

caatgcaagt caaacgttgc 7560 

aatcaggaga tatagcatga 7620 

aaagtcacac aacacaagct 7680 

cttcagtgga ctcgagtacc 7740 

cctacaacga ccatcaaagt 7800 

agcaacatct cctggataaa 7860 
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ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 



WO 2004/063359 
ctacaaagat cgttatgttt atcggcactt 

gcttgacatt ggggaattca gcgagagcct 

tgtcacgttg caagacctgc ctgaaaccga 

ggccatggat gcgatcgctg cggccgatct 

accgcaagga atcggtcaat acactacatg 

ccatgtgtat cactggcaaa ctgtgatgga 

tctcgatgag ctgatgcttt gggccgagga 

ggatttcggc tccaacaatg tcctgacgga 

gagcgaggcg atgttcgggg attcccaata 

gtggttggct tgtatggagc agcagacgcg 

aggatcgccg cggctccggg cgtatatgct 
cttggttgac ggcaatttcg atgatgcagc 
ccgatccgga gccgggactg tcgggcgtac 
gaccgatggc tgtgtagaag tactcgccga 
gagggcaaag gaatagagta gatgccgacc 
tcatcaaaca gcttgacgaa tctggatata 
ttgagacaaa tggtgttcag gatctcgata 
gtgccttcta gtgatttaat agctccatgt 
cctcttccag atacagctca tctgcaatgc 
cttncaggct ccggcgaaga gaagaatagc 
gagatcaagc agatcaacgg tcgtcaagag 
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tgcatcggcc gcgctcccga ttccggaagt 9180 

gacctattgc atctcccgcc gtgcacaggg 9240 

actgcccgct gttctgcagc cggtcgcgga 93 00 

tagccagacg agcgggttcg gcccattcgg 9360 

gcgtgatttc atatgcgcga ttgctgatcc 9420 

cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

ctgccccgaa gtccggcacc tcgtgcacgc 9540 

caatggccgc ataacagcgg tcattgactg 9600 

cgaggtcgcc aacatcttct tctggaggcc 9660 

ctacttcgag cggaggcatc cggagcttgc 9720 

ccgcattggt cttgaccaac tctatcagag 9780 

ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

acaaatcgcc cgcagaagcg cggccgtctg 9900 

tagtggaaac cgacgcccca gcactcgtcc 9960 

gcgggatcga tccacttaac gttactgaaa 1002 0 

agatcgttgg tgtcgatgtc agctccggag 10080 

agatacgttc atttgtccaa gcagcaaaga 10140 

caacaagaat aaaacgcgtt ttcgggttta 10200 

attaatgcat tgactgcaac ctagtaacgc 102 60 

ttagcagagc tattttcatt ttcgggagac 10320 

acctacgaga ctgaggaatc cgctcttggc 10380 
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tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt ttttcgagtt 10800 

tttttttttt ttctttgtga aggatttatt gttattggta tccatttttt attggaagac 10860 

aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 

aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 

agttgctttc ctctgaaaac aattcttttg tctttgcaag aaaggtttct tttttgtttg 11040 

cttgcattac ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 

ggattttctg gtcaacaaga tgtgagtgac acctaaggaa ctaaatgcca ttcatttgtt 11160 

ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 

catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 

ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 

aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 

gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 

ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 

attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 

tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 
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acgtgtttaa gcatgaaaga aaggaaacaa 
agacaaaaat gatctaaagc aagcagtaaa 
gaaaacgata aaagtctaat aagccactaa 
tggtccaatc agaccaataa tttgtgacca 
agaaaaaaat tttctcacca atcgatttaa 
ttttttctct ttaatcatta actttatcaa 
agcacaatta tgctaacatt gttccacctt 
aatcagcgtc aaggcccgcc gcgttgaact 
cctgcatgct cagcggtgct cgttagttcg 
ggcgctggga accgtgcagg ctgccggcgc 
ccagcagctt gaccgggcta tcgcagagcg 
ataccaggct gccgccattg cagcatcaat 
ctacctgaga tttgccatgc acatgaccgt 
tggcactctc ctcttggtgg ttggtggcgc 
acacaaagcc atctggcatg agtcgcctct 
acctcgcact ggaccctttg aagccaacga 
catgctcctg tgtacctttg gcttctggct 
agcggggctg ggcatcacgc tatacggcat 
gcacaggcgc tttcccaccg ggcccatcgc 
ggcccaccag ctacaccaca gcggcaagta 
tccacaggag ctgcagcaca ttccaggtgc 
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aggccgcttt gaacaaatgc ataatatttc 11700 

tcaaacaaga aacattgctg attcgcgtta 11760 

gtatacttca atgaactttt tgtatgctta 11820 

ttcctgaggt ggctttggtg atgcggaaac 11880 

aaaacaattt ctgctttgaa ccaaaacttt 11940 

gtatgtacct accctcaaag tcctcactca 12000 

ctctttagaa atgctgtcga agctgcagtc 12060 

agcccgcgac atcacgcggc ccaaagtctg 1212 0 

gctgcgagtg gcagcaccac agacagagga 12180 

gggcgatgag cacagcgccg atgtagcact 12240 

tcgtgcccgg cgcaaacggg agcagctgtc 12300 

tggcgtgtca ggcattgcca tcttcgccac 12360 

gggcggcgca gtgccatggg gtgaagtggc 12420 

gctcggcatg gagatgtatg cccgctatgc 12480 

gggctggctg ctgcacaaga gccaccacac 12540 

cttgtttgca atcatcaatg gactgcccgc 12600 

gcccaacgtc ctgggggcgg cctgctttgg 12660 

ggcatatatg tttgtacacg atggcctggt 1272 0 

tggcctgccc tacatgaagc gcctgacagt 12780 

cggtggcgcg ccctggggta tgttcttggg 12840 

ggcggaggag gtggagcgac tggtcctgga 12900 
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actggactgg tccaagcggt agaagcttgg 
gaaattgtta tccgctcaca attccacaca 
cctggggtgc ctaatgagtg agctaactca 
tccagtcggg aaacctgtcg tgccagctgc 
gcggtttgcg tattgggcca aagacaaaag 
gtaaatattg acggaaatta ttcattaaag 
tttgggaatt agagccagca aaatcaccag 
cgtcaccaat gaaaccatcg atagcagcac 
ctttagcgtc agactgtagc gcgttttcat 
cgtttgccat cttttcataa tcaaaatcac 
cctcagagcc gccaccctca gaaccgccac 

cagaaccacc accagagccg ccgccagcat 
gacaccgcgc gcgataattt atcctagttt 
taaatgtata attgcgggac tctaatcata 
tacatgttaa ttattacatg cttaacgtaa 
agaccggcaa caggattcaa tcttaagaaa 
atcatccggg tctgtggcgg gaactccacg 
tgcatctcgg tcttgcctgg gcagtcgccg 
atcatattgt cgctcaggat cgtggcgttg 
tcggcacctt cgaccgcctg ttccgcagag 
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cgtaatcatg gtcatagctg tttcctgtgt 12960 

acatacgagc cggaagcata aagtgtaaag 13020 

cattaattgc gttgcgctca ctgcccgctt 13080 

attaatgaat cggccaacgc gcggggagag 13140 

ggcgacattc aaccgattga gggagggaag 13200 

gtgaattatc accgtcaccg acttgagcca 13260 

tagcaccatt accattagca aggccggaaa 13320 

cgtaatcagt agcgacagaa tcaagtttgc 13380 

cggcattttc ggtcatagcc cccttattag 13440 

cggaaccaga gccaccaccg gaaccgcctc 13500 

cctcagagcc accaccctca gagccgccac 13560 

tgacaggagg cccgatctag taacatagat 13620 

gcgcgctata ttttgttttc tatcgcgtat 13680 

aaaacccatc tcataaataa cgtcatgcat 13740 

ttcaacagaa attatatgat aatcatcgca 13800 

ctttattgcc aaatgtttga acgatcgggg 13860 

aaaatatccg aacgcagcaa gatatcgcgg 13920 

ccgacgccgt tgatgtggac gccgggcccg 13980 

tgcttgtcgg ccgttgctgt cgtaatgata 14040 

atcccgtggg cgaagaactc cagcatgaga 14100 



WO 2004/063359 
tccccgcgct ggaggatcat ccagccggcg 
tcatagaagg cggcggtgga atcgaaatct 
gtcatttcga accccagagt cccgctcaga 
tgcgctgcga atcgggagcg gcgataccgt 
cgccaagctc ttcagcaata tcacgggtag 
cacccagccg gccacagtcg atgaatccag 
gcaagcaggc atcgccatgg gtcacgacga 
gcctggcgaa cagttcggct ggcgcgagcc 
cgacaagacc ggcttccatc cgagtacgtg 
cgaatgggca ggtagccgga tcaagcgtat 
atactttctc ggcaggagca aggtgagatg 
atagcagcca gtcccttccc gcttcagtga 
ccgtcgtggc cagccacgat agccgcgctg 
acaggtcggt cttgacaaaa agaaccgggc 
catcagagca gccgattgtc tgttgtgccc 
cggccggaga acctgcgtgc aatccatctt 
tgcagattat ttggattgag agtgaatatg 
tggaacgtca gtggagcatt tttgacaaga 
gacttttgaa cgcgcaataa tggtttctga 
acccgcggct gagtggctcc ttcaacgttg 
ttgtcccgcg tcatcggcgg gggtcataac 
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tcccggaaaa cgattccgaa gcccaacctt 14160 

cgtgatggca ggttgggcgt cgcttggtcg 14220 

agaactcgtc aagaaggcga tagaaggcga 14280 

aaagcacgag gaagcggtca gcccattcgc 14340 

ccaacgctat gtcctgatag cggtccgcca 14400 

aaaagcggcc attttccacc atgatattcg 14460 

gatcatcgcc gtcgggcatg cgcgccttga 14520 

cctgatgctc ttcgtccaga tcatcctgat 14580 

ctcgctcgat gcgatgtttc gcttggtggt 14640 

gcagccgccg cattgcatca gccatgatgg 14700 

acaggagatc ctgccccggc acttcgccca 14760 

caacgtcgag cacagctgcg caaggaacgc 14820 

cctcgtcctg cagttcattc agggcaccgg 14880 

gcccctgcgc tgacagccgg aacacggcgg 14940 

agtcatagcc . gaatagcctc tccacccaag 15000 

gttcaatcat gcgaaacgat ccagatccgg 15060 

agactctaat tggataccga ggggaattta 15120 

aatatttgct agctgatagt gaccttaggc 15180 

cgtatgtgct tagctcatta aactccagaa 15240 

cggttctgtc agttccaaac gtaaaacggc 15300 

gtgactccct taattctccg ctcatgatca 15360 
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gattgtcgtt tcccgccttc agtttaaact 

aaacctaaga gaaaagagcg tttattagaa 

tttatccgtt cgtccatttg tatgtgcatg 

ggccagcgag acgagcaaga ttggccgccg 

aggtgcgcag gcaaattgca ccaacgcata 

gacgtcgttc gagtgaacca gatcgcgcag 

gatgccgaca gcgtcgagcg cgacagtgct 

cacgtctggc ctccggacca gcctccgctg 

tgataagttg gtggacatat tatgtttatc 

cagccgaata cagtgatccg tgccgccctg 

ctgacgacac gcaaactggc ggaacggttg 

ttcaggaaca agcgggcgct gctcgacgca 

acgcattcgg tgccgagagc cgacgacgac 

agcttcaggc aggcgctgct cgcctaccgc 

ccgggcgcac cgcagatgga aacggccgac 

ttttcggccg gggacgccgt caatgcgctg 

gtgcttgagg agcaggccgg cgacagcgat 

gctccgctct cgccgctgtt gcgggccgcg 

gcagcgttcg agcagggact cgcggtgatt 

gtcaggaacg ttgaaggacc gagaaagggt 

aacccactca ctacagcaga gccatgtaga 
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atcagtgttt gacaggatat attggcgggt 15420 

taatcggata tttaaaaggg cgtgaaaagg 15480 

ccaaccacag ggttccccag atctggcgcc 15*540 

cccgaaacga tccgacagcg cgcccagcac 15600 

cagcgccagc agaatgccat agtgggcggt 15660 

gaggcccggc agcacc'ggca taatcaggcc 15720 

cagaattacg atcaggggta tgttgggttt 15780 

gtccgattga acgcgcggat tctttatcac 15840 

agtgataaag tgtcaagcat gacaaagttg 15900 

gacctgttga acgaggtcgg cgtagacggt 15960 

ggggttcagc agccggcgct ttactggcac 16020 

ctggccgaag ccatgctggc ggagaatcat 16080 

tggcgctcat ttctgatcgg gaatgcccgc 16140 

gatggcgcgc gcatccatgc cggcacgcga 16200 

gcgcagcttc gcttcctctg cgaggcgggt 16260 

atgacaatca gctacttcac tgttggggcc 16320 

gccggcgagc gcggcggcac cgttgaacag 16380 

atagacgcct tcgacgaagc cggtccggac 16440 

gtcgatggat tggcgaaaag gaggctcgtt 16500 

gacgattgat caggaccgct gccggagcgc 16560 

caacatcccc tccccctttc caccgcgtca 16620 



WO 2004/063359 
gacgcccgta gcagcccgct acgggctttt 
ggccgcgctc ggcctctctg gcggccttct 
cgctgcgctc ggtcgttcgg ctgcggcgag 
ggttatccac agaatcaggg gataacgcag 
aggccaggaa ccgtaaaaag gccgcgttgc 
acgagcatca caaaaatcga cgctcaagtc 
gataccaggc gtttccccct ggaagctccc 
ttaccggata cctgtccgcc tttctccctt 
ccctgcttcg gggtcattat agcgattttt 
acaggatttt gccaaagggt tcgtgtagac 
ggcaggatag gtgaagtagg cccacccgcg 
tcgcacctgg cggtgctcaa cgggaatcct 
gtaacagatg agggcaagcg gatggctgat 

cctatcaagg tgtactgcct tccagacgaa 
gccggcatga gcctgtcggc ctacctgctg 
gtcgtggact atgagcacgt ccgcgagctg 
ggcggcctgc tgaaactctg gctcaccgac 
acgatcctcg ccctgctggc gaagatcgaa 
atgggcgtgg tccgcccgag ggcagagcca 
ggtgcgcgtg attgccaagc acgtccccat 
gctggtgaag tacatcaccg acgagcaagg 
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tcatgccctg ccctagcgtc caagcctcac 16680 

ggcgctcttc cgcttcctcg ctcactgact 16740 

cggtatcagc tcactcaaag gcggtaatac 16800 

gaaagaacat gtgagcaaaa ggccagcaaa 16860 

tggcgttttt ccataggctc cgcccccctg 16920 

agaggtggcg aaacccgaca ggactataaa 16980 

tcgtgcgctc tcctgttccg accctgccgc 17040 

cgggaagcgt ggcgcttttc cgctgcataa 17100 

tcggtatatc catccttttt cgcacgatat 17160 

tttccttggt gtatccaacg gcgtcagccg 17220 

agcgggtgtt ccttcttcac tgtcccttat 17280 

gctctgcgag gctggccggc taccgccggc 17340 

gaaaccaagc caaccaggaa gggcagccca 17400 

cgaagagcga ttgaggaaaa ggcggcggcg 17460 

gccgtcggcc agggctacaa aatcacgggc 17520 

gcccgcatca atggcgacct gggccgcctg 17580 

gacccgcgca cggcgcggtt cggtgatgcc 17640 

gagaagcagg acgagcttgg caaggtcatg 17700 

tgactttttt agccgctaaa acggccgggg 17760 

gcgctccatc aagaagagcg acttcgcgga 17820 

caagaccgag cgcctttgcg acgctca 17877 
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<210> 38 

<211> 17238 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) .. (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 38 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 



tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 



480 
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ttttcggcca ccgctaacct gtcttttaac 
tttttaacca gggctgcgcc ctgtgcgcgt 
cttctcgaac cctcccggcc cgctaacgcg 
tcggccgcga acggcctcac cccaaaaatg 
atcggggcag taacgggatg ggcgatcagc 
ccgcaggtgc tggcatcgac attcagcgac 
ggtggcggcc tgcccttcac ttcggccgtc 
gcaattttta ccttgggcat tcttggcata 
ggtgcgataa acccagcgaa ccatttgagg 
acgagaattg gacctttaca gaattactct 
acgaagagga tgaagaggat gaggaggcag 
agataatata tcttttatat agaagatatc 
ataggcagcg cgcttatcaa tatatctata 
ctaatgcttg aaacccagga caataacctt 
atgactccaa cttattgata gtgttttatg 
agctccaccg attttgagaa cgacagcgac 
agattcaggt tatgccgctc aattcgctgc 
cccttcaggc gggattcata cagcggccag 
ggtgacagca ggctcataag acgccccagc 
gcaacaaccg tcttccggag actgtcatac 
gccccgacat agccccactg ttcgtccatt 
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ctgcttttaa accaatattt ataaaccttg 540 
gaccgcgcac gccgaagggg ggtgcccccc 600 
ggcctcccat ccccccaggg gctgcgcccc 660 
gcagcgctgg cagtccttgc cattgccggg 720 
ccgagcgcga cgcccggaag cattgacgtg 780 
caggtgccgg gcagtgaggg cggcggcctg 840 
ggggcattca cggacttcat ggcggggccg 900 
gtggtcgcgg gtgccgtgct cgtgttcggg 960 

tgataggtaa gattataccg aggtatgaaa 1020 

atgaagcgcc atatttaaaa agctaccaag 1080 

attgccttga atatattgac aatactgata 1140 

gccgtatgta aggatttcag ggggcaaggc 1200 

gaatgggcaa agcataaaaa cttgcatgga 12 60 

atagcttgta aattctatca taattgggta 1320 

ttcagataat gcccgatgac tttgtcatgc 1380 

ttccgtccca gccgtgccag gtgctgcctc 1440 

gtatatcgct tgctgattac gtgcagcttt 1500 

ccatccgtca tccatatcac cacgtcaaag 1560 

gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcgtaaaaca gccagcgctg gcgcgattta 1680 

tccgcgcaga cgatgacgtc actgcccggc 1740 
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tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta ' 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 
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cttctgcgtc cggtcgatca gggaggatat 
tgacttactg gggatcaagc ctgattggga 
attgttttag tacctagatg tggcgcaacg 
tcttccgcat caagtgtttt ggctctcagg 
ggtcgctggt attcgtgcag ggcaagattc 
cggtctacgg gaccgacttc attgccgata 
gcgggtcaaa tcaggaataa gggcacattg 
gagggtgaat gaatcggacg tttgaccgga 
ggttttccgc cgaggatgcc gaaaccatcg 
aaaccttcca gtccgtcggc tcgatggtcc 
gcgtgcaact ggctccccct gccctgcccg 
gtctcgaaca ggaggcggca ggtttggcga 
tgacgaccaa gaagcgaaaa accgccggcg 
agcaggccgc gttgctgaaa cacacgaagc 
tcgatattgc gccgtggccg gacacgatgc 
ccctgttcac cacgcgcaac aagaaaatcc 
tccacgtcaa caaggacgtg aagatcacct 
acgaactggt gtggcagcag gtgttggagt 
tcaccttcac gttctacgag ctttgccagg 
acacgaaggc cgaggaatgc ctgtcgcgcc 
accgcgttgg gcacctggaa tcggtgtcgc 
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cggggaagaa cagtatgtcg agctattttt 3000 

gaaaataaaa tattatattt tactggatga 3060 

atgccggcga caagcaggag cgcaccgact 3120 

ccgaggccca cggcaagtat ttgggcaagg 3180 

ggaataccaa gtacgagaag gacggccaga 3240 

aggtggatta tctggacacc aaggcaccag 3300 

ccccggcgtg agtcggggca atcccgcaag 3360 

aggcatacag gcaagaactg atcgacgcgg 3420 

caagccgcac cgtcatgcgt gcgccccgcg 3480 

agcaagctac ggccaagatc gagcgcgaca 3540 

cgccatcggc cgccgtggag cgttcgcgtc 3600 

agtcgatgac catcgacacg cgaggaacta 3660 

aggacctggc aaaacaggtc agcgaggcca 3720 

agcagatcaa ggaaatgcag ctttccttgt 3780 

gagcgatgcc aaacgacacg gcccgctctg 3840 

cgcgcgaggc gctgcaaaac aaggtcattt 3900 

acaccggcgt cgagctgcgg gccgacgatg 3960 

acgcgaagcg cacccctatc ggcgagccga 4020 

acctgggctg gtcgatcaat ggccggtatt 4080 

tacaggcgac ggcgatgggc ttcacgtccg 4140 

tgctgcaccg cttccgcgtc ctggaccgtg 4200 
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gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aafccgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctdtgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 
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gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
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tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 
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cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 87 60 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 
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tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 
ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 93 60 
accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 
tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 
ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 
gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 
gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
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tcttccttga actctcaagc ctacaggaca 

canttcctac taagatggta tacaatagta 

taacacccaa tacgccggcc gaaacttttt 

atgcacaggt acacttgttt agaggtaatc 

gtgtaagcgc ccactccaca tctccactcg 

gaccagtcca gttccaggac cagtcgctcc 

agctcctgtg gacccaagaa cataccccag 

agctggtggg ccactgtcag gcgcttcatg 

aagcgcctgt gcaccaggcc atcgtgtaca 

cccagccccg ctccaaagca ggccgccccc 

cacaggagca tggcgggcag tccattgatg 

ccagtgcgag gtgtgtggtg gctcttgtgc 

atggctttgt gtgcatagcg ggcatacatc 

aggagagtgc cagccacttc accccatggc 

aatctcaggt aggtggcgaa gatggcaatg 

gcagcctggt atgacagctg ctcccgtttg 

tcaagctgct ggagtgctac atcggcgctg 

gttcccagcg cctcctctgt ctgtggtgct 

tgagcatgca ggcagacttt gggccgcgtg 

ttgacgctga ttgactgcag cttcgacagc 

aagtttgtac aatttctttt tgtttatata 
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cacattcatc gtaggtataa acctcgaaat 10560 

accatgcatg gttgcctagt gaatgctccg 10620 

tacaactctc ctatgagtcg tttacccaga 10680 

cttctttcta gctagaagtc ctcgtgtact 10740 

acctgcaggc atgcaagctt ctaccgcttg 10800 

acctcctccg ccgcacctgg aatgtgctgc 10860 

ggcgcgccac cgtacttgcc gctgtggtgt 10920 

tagggcaggc cagcgatggg cccggtggga 10980 

aacatatatg ccatgccgta tagcgtgatg 11040 

aggacgttgg gcagccagaa gccaaaggta 11100 

attgcaaaca agtcgttggc ttcaaagggt 11160 

agcagccagc ccagaggcga ctcatgccag 11220 

tccatgccga gcgcgccacc aaccaccaag 11280 

actgcgccgc ccacggtcat gtgcatggca 11340 

cctgacacgc caattgatgc tgcaatggcg 11400 

cgccgggcac gacgctctgc gatagcccgg 11460 

tgctcatcgc ccgcgccggc agcctgcacg 11520 

gccactcgca gccgaactaa cgagcaccgc 11580 

atgtcgcggg ctagttcaac gcggcgggcc 11640 

atagagataa aataaaaaga gaagaaaaga 11700 

acatacacgc tatgtcaaca tttagaataa 11760 
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gggggaaaaa atcttccatc atattcgaat 
tggtcgggtc atcgagattt agagtgtaat 
caggctgctg tttgccaaat tggatgtttg 
acctttccgc tcccttttcc taattctccc 
agaaaatgta aagacaaaga aattgaaaac 
caaattggta actattcttg tgtacaaaca 
gaggacaaaa tttcaaactc cttgaagaag 
catatcgatg gaaaaagaaa gtcaggcatg 
ccgaatttct tttcactttc ttttccttat 
ggtcatagct gtttcctgtg tgaaattgtt 
ccggaagcat aaagtgtaaa gcctggggtg 
cgttgcgctc actgcccgct ttccagtcgg 
tcggccaacg cgcggggaga ggcggtttgc 
caaccgattg agggagggaa ggtaaatatt 
caccgtcacc gacttgagcc atttgggaat 
taccattagc aaggccggaa acgtcaccaa 
tagcgacaga atcaagtttg cctttagcgt 
cggtcatagc ccccttatta gcgtttgcca 
agccaccacc ggaaccgcct ccctcagagc 
caccaccctc agagccgcca ccagaaccac 
gcccgatcta gtaacataga tgacaccgcg 
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gcacaagatt atttctttgt tcgctctttt 11820 

caaagatact gtcatctcga gagcgttgca 11880 

ccgaattagt aaaatacgca agcatttctt 11940- 

aaagactaaa tgaggaaaga taaaggacaa 12000 

gatataaact tgcagcacgt aagaccaaag 12060 

tgtataaaaa aaaacttttt tttgctcctg 12120 

attgcttgta tatctatcat atgcatatat 12180 

tatttataaa aagaagaatg tgccatgctt 12240 

ctattttaat ctcaagcttg gcgtaatcat 12300 

atccgctcac aattccacac aacatacgag 12360 

cctaatgagt gagctaactc acattaattg 12420 

gaaacctgtc gtgccagctg cattaatgaa 12480 

gtattgggcc aaagacaaaa gggcgacatt 12540 

gacggaaatt attcattaaa ggtgaattat 12600 

tagagccagc aaaatcacca gtagcaccat 12660 

tgaaaccatc gatagcagca ccgtaatcag 12720 

cagactgtag cgcgttttca tcggcatttt 12780 

tcttttcata atcaaaatca ccggaaccag 12840 

cgccaccctc agaaccgcca ccctcagagc 12900 

caccagagcc gccgccagca ttgacaggag 12960 

cgcgataatt tatcctagtt tgcgcgctat 13020 
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attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 

ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 

aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 

caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 

gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 

ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 

gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 

gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 

acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 

aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 

caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13680 

ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 

tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 

cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13860 

cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 

cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 139 80 

tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 

gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 

cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 

gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 

gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14280 



WO 2004/063359 PCT/EP2004/000099 

122/357 



ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 

cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 

tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 

ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 

tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14580 

ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 

ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 

gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 

cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 

cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 

gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 

aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15240 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 

gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15540 
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cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15600 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 

agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16380 

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16440 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 
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attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

gcgcctttgc gacgctca 17238 
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<400> 39 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 9 60 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
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ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
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tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg atfegtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 
aaaccttcca gtccgtcggc tcgatggtac agcaagctac ggccaagatc gagcgcgaca 3540 
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 



WO 2004/063359 PCT/EP2004/000099 

128/357 



tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 



WO 2004/063359 PCT/EP2004/000099 

129/357 



tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acc tact tec tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagcegggga tgeatcagge 5640 

egacagtegg aacttegggt ccccgacctg taccattegg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc ageggcttta 5760 

tecagegatt tcctattatg teggcatagt tctcaagatc gaeagectgt cacggttaag 582 0 

cgagaaatga ataagaaggc tgataattcg gatctctgeg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgeta ccctccgcga gatcatccgt 5940 

gtttcaaacc eggcagctta gttgccgttc ttccgaatag categgtaac atgagcaaag 6000 

tctgccgcct tacaaegget ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agetgeeggt eggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgaegctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggega 6300 
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aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 73 80 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
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tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 87 00 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
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tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 
gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 
cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 
gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 
tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 
atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 
tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 
canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 
gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt agagataaaa 10800 
taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacacgcta 10860 
tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 
ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca aagatactgt 10980 
catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 
aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 
aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 
cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg tataaaaaaa 11220 
aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 
tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 
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gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 

catgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 

catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 11520 

ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 

gcacagcgcc gatgtagcac tccagcagct tgaccgggct atcgcagagc gtcgtgcccg 11640 

gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 

aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 

agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 

ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 11880 

gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 

aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 

cctgggggcg gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 

gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 

ctacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 

gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg gcgtaatcat 12300 
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 12360 
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 12420 
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12480 
tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12540 
caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12600 
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caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12660 
taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12720 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12780 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12840 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12900 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12960 
gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 13020 
attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 13080 
ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13140 
aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13200 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13260 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13320 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13380 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13440 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13500 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13560 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13620 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13680 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13740 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13800 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13860 
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cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13920 

cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13980 

tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 14040 

gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 14100 

cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14160 

gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14220 

gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14280 

ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14340 

cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14400 

tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14460 

ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14520 

tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14580 

ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14640 

cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14700 

ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14760 

tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14820 

atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14880 

gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14940 

atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 15000 

cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 15060 

cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15120 
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gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15180 

aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15240 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15300 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15360 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15420 

gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15480 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15540 

cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15600 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15660 

agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15720 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15780 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15840 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15900 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15960 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 16020 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 16080 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16140 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16200 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16260 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16320 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 163 80 
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ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16440 

tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16500 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16560 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16620 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16680 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16740 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16800 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16860 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16920 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16980 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 17040 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 17100 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17160 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17220 

gcgcctttgc gacgctca j./«o 



<210> 40 

<211> 18449 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 



WO 2004/063359 PCT/EP2004/000099 

139/357 

<2 2 1> misc_f eature 
<222> (3471) . . (3471) 
<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (3679) (3679) 

<223> n is a, c, g, or t 

<220> 

< 2 2 1 > mi s c_f ea t ur e 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 40 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 
cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 
cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 
cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 
tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 
gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 
gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 
atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 
tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 
aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 
gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 
ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 
tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 



tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 



840 
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caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg- 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 
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gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 
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atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840' 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc' 4440 
taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 
tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 
aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 
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gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcggta gattgtgact gatagcgaga ctctgggtcg 5520 

atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 
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gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 63 00 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 6360 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 

cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 
ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 
accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 
ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 
ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 
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gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 73 80 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 
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cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 

gttccaaacg taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtbtc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 
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gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 

tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500. 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 



WO 2004/063359 PCT/EP2004/000099 

148/357 



atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 
tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 
cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 
ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 
aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 
tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 
gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 
tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 
ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 
cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 
agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 
gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 
cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 
tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 
tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 
gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 
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atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 

aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 

ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 123 60 

ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 

tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 

cttcatggcg gggccggcaa tttttaectt gggcattctt ggcatagtgg tcgcgggtgc 12600 

cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 

ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 

ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 

attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 

tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 

taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 

ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 

gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 

tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 

gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 

ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 

gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 
gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 
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cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 
ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 . 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 
cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 
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atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 
ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc ata'caggcaa 15060 
gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120- 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 
gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 
caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 
atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 
gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 
caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 
ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 
cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcqtaca ggcgacggcg 15780 
atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 
cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 
gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 
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tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 

acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 

ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 

taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 

cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 

cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 

ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 

ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 

ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 
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tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 

cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 

ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 

ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 

acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 

ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 

gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 

ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 18360 

tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 
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ggccagtgaa ttcgagctcg gtacccggg 
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<223> Plasmid 



<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 



<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 



<220> 

<221> misc_feature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 41 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 
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tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 
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tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 192 0 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

ghtcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 
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aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgt'tcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

attfcaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

otttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 4260 
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ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 

aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 

caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 
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atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 

aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 6360 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 

cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 6720 

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 
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ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 

gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 
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agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 8280 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 

attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 8700 

gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

age teat taa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 

gttccaaacg taaaaegget tgtcccgcgt categgeggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aateggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 
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gttccccaga tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat 9360 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca 9420 

gaatgccata gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgcgcggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa 9720 

cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 

gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 

catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 

tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 
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cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgc.tct 10800 
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 
gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 
atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 
tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 
cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 
ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 
aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 
tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 112 80 
gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 
tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 
ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 
cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 
gccgctaaaa cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca 11580 
agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 
gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 
cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 
tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 
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tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 

gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 

ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 

gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 

tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 

aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 

atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 

aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 

ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 123 60 

ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 

tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 

cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 

cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 

ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 

ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 

attgacaata ctgataagat aatatatct.t ttatatagaa gatatcgccg tatgtaagga 12840 

tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 

taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 
ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 
gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 
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tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 

gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 

ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 

gcgctggcgc gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat 13380 

gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 

cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 

ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 

tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 

ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 

gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 

cataattgtg gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac 13800 

aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13 860 

gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 

ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 

accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 

aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 

tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 

tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc 14220 

tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 

agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
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acagccgctt agccgaattg gattacfctac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 
atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 
ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 
gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 
gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 
caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 
atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 
gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 
caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 
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ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 

cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 

atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 

atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 

cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 

gtc'gtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 

tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 

aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 163 80 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 

acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 

ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 
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taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 

cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 

cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 

ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 

ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 

ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 

tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 172 80 

cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 

ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 

ccgcgagatc atccgtgttt caaacccggc agcttagttg. ccgttcttcc gaatagcatc 17 640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 

acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17880 
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 
ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 
aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 
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ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 
tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 
ggccagtgaa ttcgagctcg gtacccggg 



<210> 42 

<211> 17593 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc__feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 42 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 



aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 
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aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 
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agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2 040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 
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tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
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tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 43 80 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 



WO 2004/063359 PCT/EP2004/000099 

174/357 



cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 
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actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 73 80 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 
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gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 79 80 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 
tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 
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ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 
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cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

cant tec tac taagatggta tacaatagta accatgeatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgeaagett ttttcgagtt 10800 

tttttttttt ttctttgtga aggatttatt gttattggta tccatttttt attggaagac 10860 

aagataagtt aatattgatt ttgcttaaag attaaaagga aatcagaaaa cgacaataaa 10920 

aaatgtaacg gacaaactat ggtgtcgatt ataagtctaa atccttaaaa aatgacaacg 10980 

agttgctttc ctctgaaaac aattcttttg tetttgeaag aaaggtttct tttttgtttg 11040 

ettgeattae ttaaacatca aatcaaatga aaggaataaa gcagatttga gggcgaataa 11100 

ggattttctg gtcaacaaga tgtgagtgac acctaaggaa etaaatgeca ttcatttgtt 11160 

ttaaaacgac atcaaagatt gatgatcaac aggattgaga gagagaaaaa gaactcgtgt 11220 

catttatttc tgttgactga aattttatat ttagaaaaaa tgtcaaatct atagctttag 11280 

ctatattaca taacatttga aataataata ataaaaaaag acacattaga gacacttttc 11340 

aaactctaaa taactgtcta taaacacaaa gaaaacaaag acctctataa caacttatta 11400 

gatttttctc gtacttttgt ctaaagatga tgtattcttg ttatcccaca cttctttcat 11460 
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ttgttcttga tgctactaaa tatacaaaat ttcttttttg caagagatat tattccaaaa 11520 

attttcaaaa agaaattttt ttcacaatag cagttgatcg tgtaacccaa agaggttctt 11580 

tgttattttg cacttccgct ttgcggtgat gcatattcaa agtaatatat ggaataaaca 11640 

acgtgtttaa gcatgaaaga aaggaaacaa aggccgcttt gaacaaatgc ataatatttc 11700 

agacaaaaat gatctaaagc aagcagtaaa tcaaacaaga aacattgctg attcgcgtta 11760 

gaaaacgata aaagtctaat aagccactaa gtatacttca atgaactttt tgtatgctta 11820 

tggtccaatc agaccaataa tttgtgacca ttcctgaggt ggctttggtg atgcggaaac 11880 

agaaaaaaat tttctcacca atcgatttaa aaaacaattt ctgctttgaa ccaaaacttt 11940 

ttttttctct ttaatcatta actttatcaa gtatgtacct accctcaaag tcctcactca 12000 

agcacaatta tgctaacatt gttccacctt ctctttagaa atgttgtgga tttggaatgc 12060 

cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt gctgcactgg cacacaaata 12120 

catcatgcac ggctggggtt ggggatggca tctttcacat catgaaccgc gtaaaggtgc 12180 

gtttgaagtt aacgatcttt atgccgtggt ttttgctgca ttatcgatcc tgctgattta 12240 

tctgggcagt acaggaatgt ggccgctcca gtggattggc gcaggtatga cggcgtatgg 12300 

attactctat tttatggtgc acgacgggct ggtgcatcaa cgttggccat tccgctatat 12360 

tccacgcaag ggctacctca aacggttgta tatggcgcac cgtatgcatc acgccgtcag 12420 

gggcaaagaa ggttgtgttt cttttggctt cctctatgcg ccgcccctgt caaaacttca 12480 
ggcgacgctc cgggaaagac atggcgctag agcgggcgct gccagagatg cgcagggcgg 12540 
ggaggatgag cccgcatccg ggaagtaagg gcctgaccag aggcggccag cagcagcgtt 12600 
aatttttcgg gcgtggtcgt tgactgccgc tgatcccaaa gcttggcgta atcatggtca 12660 
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 12720 
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agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 12780 
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 12840 
caacgcgcgg ggagaggcgg tttgcgtatt gggccaaaga caaaagggcg acattcaacc 12900 
gattgaggga gggaaggtaa atattgacgg aaattattca ttaaaggtga attatcaccg 12960 
tcaccgactt gagccatttg ggaattagag ccagcaaaat caccagtagc accattacca 13020 
ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag cagcaccgta atcagtagcg 13080 
acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt tttcatcggc attttcggtc 13140 
atagccccct tattagcgtt tgccatcttt tcataatcaa aatcaccgga accagagcca 13200 
ccaccggaac cgcctccctc agagccgcca ccctcagaac cgccaccctc agagccacca 13260 
ccctcagagc cgccaccaga accaccacca gagccgccgc cagcattgac aggaggcccg 13320 
atctagtaac atagatgaca ccgcgcgcga taatttatcc tagtttgcgc gctatatttt 13380 
gttttctatc gcgtattaaa tgtataattg cgggactcta atcataaaaa cccatctcat 13440 
aaataacgtc atgcattaca tgttaattat tacatgctta acgtaattca acagaaatta 13500 
tatgataatc atcgcaagac cggcaacagg attcaatctt aagaaacttt attgccaaat 13560 
gtttgaacga tcggggatca tccgggtctg tggcgggaac tccacgaaaa tatccgaacg 13620 
cagcaagata tcgcggtgca tctcggtctt gcctgggcag tcgccgccga cgccgttgat 13680 
gtggacgccg ggcccgatca tattgtcgct caggatcgtg gcgttgtgct tgtcggccgt 13740 
tgctgtcgta atgatatcgg caccttcgac cgcctgttcc gcagagatcc cgtgggcgaa 13800 
gaactccagc atgagatccc cgcgctggag gatcatccag ccggcgtccc ggaaaacgat 13860 
tccgaagccc aacctttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 13920 
gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg ctcagaagaa ctcgtcaaga 13980 
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aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga taccgtaaag cacgaggaag 14040 

cggtcagccc attcgccgcc aagctcttca gcaatatcac gggtagccaa cgctatgtcc 14100 

tgatagcggt ccgccacacc cagccggcca cagtcgatga atccagaaaa gcggccattt 14160 

tccaccatga tattcggcaa gcaggcatcg ccatgggtca cgacgagatc atcgccgtcg 14220 

ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg cgagcccctg atgctcttcg 14280 

tccagatcat cctgatcgac aagaccggct tccatccgag tacgtgctcg ctcgatgcga 14340 

tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa gcgtatgcag ccgccgcatt 14400 

gcatcagcca tgatggatac tttctcggca ggagcaaggt gagatgacag gagatcctgc 14460 

cccggcactt cgcccaatag cagccagtcc cttcccgctt cagtgacaac gtcgagcaca 14520 

gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc gcgctgcctc gtcctgcagt 14580 

tcattcaggg caccggacag gtcggtcttg acaaaaagaa ccgggcgccc ctgcgctgac 14640 

agccggaaca cggcggcatc agagcagccg attgtctgtt gtgcccagtc atagccgaat 14700 

agcctctcca cccaagcggc cggagaacct gcgtgcaatc catcttgttc aatcatgcga 14760 

aacgatccag atccggtgca gattatttgg attgagagtg aatatgagac tctaattgga 14820 

taccgagggg aatttatgga acgtcagtgg agcatttttg acaagaaata tttgctagct 14880 

gatagtgacc ttaggcgact tttgaacgcg caataatggt ttctgacgta tgtgcttagc 14940 

tcattaaact ccagaaaccc gcggctgagt ggctccttca acgttgcggt tctgtcagtt 15000 

ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt cataacgtga ctcccttaat 15060 

tctccgctca tgatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca 15120 

ggatatattg gcgggtaaac ctaagagaaa agagcgttta ttagaataat cggatattta 15180 

aaagggcgtg aaaaggttta tccgttcgtc catttgtatg tgcatgccaa ccacagggtt 15240 
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ccccagatct ggcgccggcc agcgagacga gcaagattgg ccgccgcccg aaacgatccg 15300 

acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa cgcatacagc gccagcagaa 15360 

tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc gcgcaggagg cccggcagca 15420 

ccggcataat caggccgatg ccgacagcgt cgagcgcgac agtgctcaga attacgatca 15480 

ggggtatgtt gggtttcacg tctggcctcc ggaccagcct ccgctggtcc gattgaacgc 15540 

gcggattctt tatcactgat aagttggtgg acatattatg tttatcagtg ataaagtgtc 15600 

aagcatgaca aagttgcagc cgaatacagt gatccgtgcc gccctggacc tgttgaacga 15660 

ggtcggcgta gacggtctga cgacacgcaa actggcggaa cggttggggg ttcagcagcc 15720 

ggcgctttac tggcacttca ggaacaagcg ggcgctgctc gacgcactgg ccgaagccat 15780 

gctggcggag aatcatacgc attcggtgcc gagagccgac gacgactggc gctcatttct 15840 

gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc taccgcgatg gcgcgcgcat 15900 

ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg gccgacgcgc agcttcgctt 15960 

cctctgcgag gcgggttttt cggccgggga cgccgtcaat gcgctgatga caatcagcta 16020 

cttcactgtt ggggccgtgc ttgaggagca ggccggcgac agcgatgccg gcgagcgcgg 16080 

cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg gccgcgatag acgccttcga 16140 

cgaagccggt ccggacgcag cgttcgagca gggactcgcg gtgattgtcg atggattggc 16200 

gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga aagggtgacg attgatcagg 16260 

accgctgccg gagcgcaacc cactcactac agcagagcca tgtagacaac atcccctccc 16320 

cctttccacc gcgtcagacg cccgtagcag cccgctacgg gctttttcat gccctgccct 16380 
agcgtccaag cctcacggcc gcgctcggcc tctctggcgg ccttctggcg ctcttccgct 16440 
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 16500 
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tcaaaggcgg taatacggtt atccacagaa 
gcaaaaggcc agcaaaaggc caggaaccgt 
aggctccgcc cccctgacga gcatcacaaa 
ccgacaggac tataaagata ccaggcgttt 
gttccgaccc tgccgcttac cggatacctg 
cttttccgct gcataaccct gcttcggggt 
ctttttcgca cgatatacag gattttgcca 
ccaacggcgt cagccgggca ggataggtga 
cttcactgtc ccttattcgc acctggcggt 
gccggctacc gccggcgtaa cagatgaggg 
caggaagggc agcccaccta tcaaggtgta 
ggaaaaggcg gcggcggccg gcatgagcct 
ctacaaaatc acgggcgtcg tggactatga 
cgacctgggc cgcctgggcg gcctgctgaa 
gcggttcggt gatgccacga tcctcgccct 
gcttggcaag gtcatgatgg gcgtggtccg 
gctaaaacgg ccggggggtg cgcgtgattg 
agagcgactt cgcggagctg gtgaagtaca 
tttgcgacgc tea 

<210> 43 
<211> 16954 
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tcaggggata aegcaggaaa gaacatgtga 16560 

aaaaaggccg cgttgctggc gtttttccat 16620 

aatcgacget caagtcagag gtggcgaaac 16680 

ccccctggaa gctccctcgt gcgctctcct 16740 

tccgcctttc tcccttcggg aagcgtggcg 16800 

cattatagcg attttttegg tatatccatc 16860 

aagggttcgt gtagactttc cttggtgtat 16920 

agtaggecca cccgcgagcg ggtgttcctt 16980 

getcaaeggg aatcctgctc tgcgaggctg 17040 

caageggatg gctgatgaaa ccaagccaac 17100 

ctgccttcca gacgaacgaa gagegattga 17160 

gtcggcctac ctgctggccg teggecaggg 17220 

gcacgtccgc gagctggccc gcatcaatgg 17280 

actctggctc accgacgacc cgcgcacggc 17340 

gctggcgaag atcgaagaga agcaggacga 17400 

cccgagggca gagecatgae ttttttagee 17460 

ccaagcacgt ccccatgcgc tccatcaaga 17520 

tcaccgacga gcaaggcaag accgagcgcc 17580 

17593 
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<212> DNA 

<213> Artificial 



<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<2 2 1 > mi sc_f eatur e 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 

<400> 43 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 
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cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 
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tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 
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tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 . 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 372 0 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 37 80 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 43 80 
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gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa ■ cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 
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cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 
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gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
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acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 882 0 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 
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ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 97 80 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 
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atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccacteg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 

tatgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 

tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 11520 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 

attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 

cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 

acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 

ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 

gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 

tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 
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gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 

ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 

taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180 

cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 

acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 

attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 

tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 

gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagcgcg 12480 

ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 

aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 

ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 

ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 

ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 

aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 

aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 

taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 12960 

ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 

gtcgccgccg acgccgttga tgtggacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 

ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 

cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 
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gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 
gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 
gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 133 80 
ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 
acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 13860 
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 13920 
cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14040 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 
ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 
gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 
gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 
tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 
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ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 

attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 

gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 

gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 

acgcatacag cgccagcaga atgccatagt gggcggtgac gtcgttcgag tgaaccagat 147 60 

cgcgcaggag gcccggcagc accggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 

cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 

tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 

gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 

cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 

acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 

cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 

cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 

ctaccgcgat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 15300 

ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 153 60 

tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 

cagcgatgcc ggcgagcgcg gcggcaccg.t tgaacaggct ccgctctcgc cgctgttgcg 15480 

ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 

ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 

aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 

atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 
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ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 15780 

gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 16140 

ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 

gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 

tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 

acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaacgg 16380 

gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 

ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 

agacgaacga agagcgattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 16560 

cctgctggcc gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 

cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 

caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 

gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 

agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 168 60 

tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 

agcaaggcaa gaccgagcgc ctttgcgacg ctca 16954 
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<210> 44 

<211> 16954 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> mis cofeature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 



<400> 44 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 
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ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 13 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 13 80 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 
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tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 
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tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 33 60 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 37 80 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3560 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 
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gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgc T tgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 
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agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 
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ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
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accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 



WO 2004/063359 PCTYEP2004/000099 

206/357 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960- 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 



WO 2004/063359 PCT/EP2004/000099 

207/357 

cant tec tac taagatggta tacaatagta accatgeatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgeaagett agagataaaa 10800 

taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac atacaegcta 10860 

tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc acaagattat 10920 

ttctttgttc gctctttttg gtegggtcat cgagatttag agtgtaatca aagatactgt 10980 

catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc gaattagtaa 11040 

aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa agactaaatg 11100 

aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga tataaacttg 11160 

cagcaegtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg tataaaaaaa 11220 

aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat tgcttgtata 11280 

tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta tttataaaaa 11340 

gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct attttaatct 11400 

catgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 

tgctgcactg gcacacaaat acatcatgea cggctggggt tggggatggc atctttcaca 11520 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 

attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 

cgcaggtatg aeggegtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 

acgttggcca ttcegctata ttccacgcaa gggctacctc aaacggttgt atatggegea 11760 

cegtatgeat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 
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gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 

tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 

gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 12060 

ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 12120 

taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 12180 

cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggccaaag 12240 

acaaaagggc gacattcaac cgattgaggg agggaaggta aatattgacg gaaattattc 12300 

attaaaggtg aattatcacc gtcaccgact tgagccattt gggaattaga gccagcaaaa 12360 

tcaccagtag caccattacc attagcaagg ccggaaacgt caccaatgaa accatcgata 12420 

gcagcaccgt aatcagtagc gacagaatca agtttgcctt tagcgtcaga ctgtagcgcg 12480 

ttttcatcgg cattttcggt catagccccc ttattagcgt ttgccatctt ttcataatca 12540 

aaatcaccgg aaccagagcc accaccggaa ccgcctccct cagagccgcc accctcagaa 12600 

ccgccaccct cagagccacc accctcagag ccgccaccag aaccaccacc agagccgccg 12660 

ccagcattga caggaggccc gatctagtaa catagatgac accgcgcgcg ataatttatc 12720 

ctagtttgcg cgctatattt tgttttctat cgcgtattaa atgtataatt gcgggactct 12780 

aatcataaaa acccatctca taaataacgt catgcattac atgttaatta ttacatgctt 12840 

aacgtaattc aacagaaatt atatgataat catcgcaaga ccggcaacag gattcaatct 12900 

taagaaactt tattgccaaa tgtttgaacg atcggggatc atccgggtct gtggcgggaa 12960 

ctccacgaaa atatccgaac gcagcaagat atcgcggtgc atctcggtct tgcctgggca 13020 

gtcgccgccg acgccgttga tgtggacgcc gggcccgatc atattgtcgc tcaggatcgt 13080 
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ggcgttgtgc ttgtcggccg ttgctgtcgt aatgatatcg gcaccttcga ccgcctgttc 13140 

cgcagagatc ccgtgggcga agaactccag catgagatcc ccgcgctgga ggatcatcca 13200 

gccggcgtcc cggaaaacga ttccgaagcc caacctttca tagaaggcgg cggtggaatc 13260 

gaaatctcgt gatggcaggt tgggcgtcgc ttggtcggtc atttcgaacc ccagagtccc 13320 

gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc gggagcggcg 13380 

ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 13440 

cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 13500 

aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 13560 

acgacgagat catcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 13620 

gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 13680 

gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 13740 

agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 13800 

tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 13860 

tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 13920 

cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 13980 

accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 14040 

tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 14100 

ccatcttgtt caatcatgcg aaacgatcca gatccggtgc agattatttg gattgagagt 14160 

gaatatgaga ctctaattgg ataccgaggg gaatttatgg aacgtcagtg gagcattttt 14220 

gacaagaaat atttgctagc tgatagtgac cttaggcgac ttttgaacgc gcaataatgg 14280 

tttctgacgt atgtgcttag ctcattaaac tccagaaacc cgcggctgag tggctccttc 14340 
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aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 14400 

tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 14460 

ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 14520 

attagaataa tcggatattt aaaagggcgt gaaaaggttt atccgttcgt ccatttgtat 14580 

gtgcatgcca accacagggt tccccagatc tggcgccggc cagcgagacg agcaagattg 14640 

gccgccgccc gaaacgatcc gacagcgcgc ccagcacagg tgcgcaggca aattgcacca 14700 

acgcatacag cgccagcaga afcgccatagt gggcggtgac gtcgttcgag tgaaccagat 14760 

cgcgcaggag gcccggcagc accggcataa tcaggccgat gccgacagcg tcgagcgcga 14820 

cagtgctcag aattacgatc aggggtatgt tgggtttcac gtctggcctc cggaccagcc 14880 

tccgctggtc cgattgaacg cgcggattct ttatcactga taagttggtg gacatattat 14940 

gtttatcagt gataaagtgt caagcatgac aaagttgcag ccgaatacag tgatccgtgc 15000 

cgccctggac ctgttgaacg aggtcggcgt agacggtctg acgacacgca aactggcgga 15060 

acggttgggg gttcagcagc cggcgcttta ctggcacttc aggaacaagc gggcgctgct 15120 

cgacgcactg gccgaagcca tgctggcgga gaatcatacg cattcggtgc cgagagccga 15180 

cgacgactgg cgctcatttc tgatcgggaa tgcccgcagc ttcaggcagg cgctgctcgc 15240 

ctaccgcgat ggcgcgcgca tccatgccgg cacgcgaccg ggcgcaccgc agatggaaac 15300 

ggccgacgcg cagcttcgct tcctctgcga ggcgggtttt tcggccgggg acgccgtcaa 153 60 

tgcgctgatg acaatcagct acttcactgt tggggccgtg cttgaggagc aggccggcga 15420 
cagcgatgcc ggcgagcgcg gcggcaccgt tgaacaggct ccgctctcgc cgctgttgcg 15480 
ggccgcgata gacgccttcg acgaagccgg tccggacgca gcgttcgagc agggactcgc 15540 
ggtgattgtc gatggattgg cgaaaaggag gctcgttgtc aggaacgttg aaggaccgag 15600 
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aaagggtgac gattgatcag gaccgctgcc ggagcgcaac ccactcacta cagcagagcc 15660 

atgtagacaa catcccctcc ccctttccac cgcgtcagac gcccgtagca gcccgctacg 15720 

ggctttttca tgccctgccc tagcgtccaa gcctcacggc cgcgctcggc ctctctggcg 157 80 

gccttctggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 15840 

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 15900 

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 15960 

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 16020 

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 16080 

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 16140 

ctcccttcgg gaagcgtggc gcttttccgc tgcataaccc tgcttcgggg tcattatagc 16200 

gattttttcg gtatatccat cctttttcgc acgatataca ggattttgcc aaagggttcg 16260 

tgtagacttt ccttggtgta tccaacggcg tcagccgggc aggataggtg aagtaggccc 16320 

acccgcgagc gggtgttcct tcttcactgt cccttattcg cacctggcgg tgctcaacgg 16380 

gaatcctgct ctgcgaggct ggccggctac cgccggcgta acagatgagg gcaagcggat 16440 

ggctgatgaa accaagccaa ccaggaaggg cagcccacct atcaaggtgt actgccttcc 16500 

agacgaacga agagcgattg aggaaaaggc ggcggcggcc ggcatgagcc tgtcggccta 16560 

cc tgctggcc gtcggccagg gctacaaaat cacgggcgtc gtggactatg agcacgtccg 16620 

cgagctggcc cgcatcaatg gcgacctggg ccgcctgggc ggcctgctga aactctggct 16680 

caccgacgac ccgcgcacgg cgcggttcgg tgatgccacg atcctcgccc tgctggcgaa 16740 

gatcgaagag aagcaggacg agcttggcaa ggtcatgatg ggcgtggtcc gcccgagggc 16800 

agagccatga cttttttagc cgctaaaacg gccggggggt gcgcgtgatt gccaagcacg 16860 
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tccccatgcg ctccatcaag aagagcgact tcgcggagct ggtgaagtac atcaccgacg 16920 
agcaaggcaa gaccgagcgc ctttgcgacg ctca 16954 



<210> 45 

<211> 19491 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (18970) . . (18970) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (19178) . . (19178) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (19269) . . (19269) 

<223> n is a, c, g, or t 

<400> 45 

agcttggtac cgagctcgga tccactagta acggccgcca gtgtgctgga attcgccctt 60 
gacggccagt gaattcgagc tcggtacccg gggatctttc gacactgaaa tacgtcgagc 120 
ctgctccgct tggaagcggc gaggagcctc gtcctgtcac aactaccaac atggagtacg 180 
ataagggcca gttccgccag ctcattaaga gccagttcat gggcgttggc atgatggccg 
tcatgcatct gtacttcaag tacaccaacg ctcttctgat ccagtcgatc atccgctgaa 



240 
300 



ggcgctttcg aatctggtta agatccacgt cttcgggaag ccagcgactg gtgacctcca 
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gcgtcccttt aaggctgcca acagctttct cagccagggc cagcccaaga ccgacaaggc 420 

ctccctccag aacgccgaga agaactggag gggtggtgtc aaggaggagt aagctcctta 480 

ttgaagtcgg aggacggagc ggtgtcaaga ggatattctt cgactctgta ttatagataa 540 

gatgatgagg aattggaggt agcatagctt catttggatt tgctttccag gctgagactc 600 

tagcttggag catagagggt cctttggctt tcaatattct caagtatctc gagtttgaac 660 

ttattccctg tgaacctttt attcaccaat gagcattgga atgaacatga atctgaggac 720 

tgcaatcgcc atgaggtttt cgaaatacat ccggatgtcg aaggcttggg gcacctgcgt 780 

tggttgaatt tagaacgtgg cactattgat catccgatag ctctgcaaag ggcgttgcac 840 

aatgcaagtc aaacgttgct agcagttcca ggtggaatgt tatgatgagc attgtattaa 900 

atcaggagat atagcatgat ctctagttag ctcaccacaa aagtcagacg gcgtaaccaa 960 

aagtcacaca acacaagctg taaggatttc ggcacggcta cggaagacgg agaagccacc 1020 

ttcagtggac tcgagtacca tttaattcta tttgtgtttg atcgagacct aatacagccc 1080 

ctacaacgac catcaaagtc gtatagctac cagtgaggaa gtggactcaa atcgacttca 1140 

gcaacatctc ctggataaac tttaagccta aactatacag aataagatag gtggagagct 1200 

tataccgagc tcccaaatct gtccagatca tggttgaccg gtgcctggat cttcctatag 1260 

aatcatcctt attcgttgac ctagctgatt ctggagtgac ccagagggtc atgacttgag 1320 

cctaaaatcc gccgcctcca ccatttgtag aaaaatgtga cgaactcgtg agctctgtac 1380 

agtgaccggt gactctttct ggcatgcgga gagacggacg gacgcagaga gaagggctga 1440 

gtaataagcc actggccaga cagctctggc ggctctgagg tgcagtggat gattattaat 1500 

ccgggaccgg ccgcccctcc gccccgaagt ggaaaggctg gtgtgcccct cgttgaccaa 1560 

gaatctattg catcatcgga gaatatggag cttcatcgaa tcaccggcag taagcgaagg 1620 
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agaatgtgaa gccaggggtg tatagccgtc ggcgaaatag catgccatta acctaggtac 1680 

agaagtccaa ttgcttccga tctggtaaaa gattcacgag atagtacctt ctccgaagta 1740 

ggtagagcga gtacccggcg cgtaagctcc ctaattggcc catccggcat ctgtagggcg 1800 

tccaaatatc gtgcctctcc tgctttgccc ggtgtatgaa accggaaagg ccgctcagga 1860 

gctggccagc ggcgcagacc gggaacacaa gctggcagtc gacccatccg gtgctctgca 1920 

ctcgacctgc tgaggtccct cagtccctgg taggcagctt tgccccgtct gtccgcccgg 1980 

tgtgtcggcg gggttgacaa ggtcgttgcg tcagtccaac atttgttgcc atattttcct 2040 

gctctcccca ccagctgctc ttttcttttc tctttctttt cccatcttca gtatattcat 2100 

cttcccatcc aagaaccttt atttccccta agtaagtact ttgctacatc catactccat 2160 

ccttcccatc ccttattcct ttgaaccttt cagttcgagc tttcccactt catcgcagct 2220 

tgactaacag ctaccccgct tgagcagaca tcaccatgct gtcgaagctg cagtcaatca 2280 

gcgtcaaggc ccgccgcgtt gaactagccc gcgacatcac gcggcccaaa gtctgcctgc 2340 

atgctcagcg gtgctcgtta gttcggctgc gagtggcagc accacagaca gaggaggcgc 2400 

tgggaaccgt gcaggctgcc ggcgcgggcg atgagcacag cgccgatgta gcactccagc 2460 

agcttgaccg ggctatcgca gagcgtcgtg cccggcgcaa acgggagcag ctgtcatacc 2520 

aggctgccgc cattgcagca tcaattggcg tgtcaggcat tgccatcttc gccacctacc 2580 

tgagatttgc catgcacatg accgtgggcg gcgcagtgcc atggggtgaa gtggctggca 2640 

ctctcctctt ggtggttggt ggcgcgctcg gcatggagat gtatgcccgc tatgcacaca 2700 

aagccatctg gcatgagtcg cctctgggct ggctgctgca caagagccac cacacacctc 2760 

gcactggacc ctttgaagcc aacgacttgt ttgcaatcat caatggactg cccgccatgc 2820 

tcctgtgtac ctttggcttc tggctgccca acgtcctggg ggcggcctgc tttggagcgg 2880 
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ggctgggcat cacgctatac ggcatggcat atatgtttgt acacgatggc ctggtgcaca 2940 

ggcgctttcc caccgggccc atcgctggcc tgccctacat gaagcgcctg acagtggccc 3000 

accagctaca ccacagcggc aagtacggtg gcgcgccctg gggtatgttc ttgggtccac 3060 

aggagctgca gcacattcca ggtgcggcgg aggaggtgga gcgactggtc ctggaactgg 3120 

actggtccaa gcggtagggt gcggaaccag gcacgctggt ttcacacctc atgcctgtga 3180 

taaggtgtgg ctagagcgat gcgtgtgaga cgggtatgtc acggtcgact ggtctgatgg 3240 

ccaatggcat cggccatgtc tggtcatcac gggctggttg cctgggtgaa ggtgatgcac 3300 

atcatcatgt gcggttggag gggctggcac agtgtgggct gaactggagc agttgtccag 3360 

gctggcgttg aatcagtgag ggtttgtgat tggcggttgt gaagcaatga ctccgcccat 3420 

attctatttg tgggagctga gatgatggca tgcttgggat gtgcatggat catggtagtg 3480 

cagcaaacta tattcaccta gggctgttgg taggatcagg tgaggccttg cacattgcat 3540 

gatgtactcg tcatggtgtg ttggtgagag gatggatgtg gatggatgtg tattctcaga 3 600 

cgtagacctt gactggaggc ttgatcgaga gagtgggccg tattctttga gaggggaggc 3660 

tcgtgccaga aatggtgagt ggatgactgt gacgctgtac attgcaggca ggtgagatgc 3720 

actgtctcga ttgtaaaata cattcagatg caagcttggc gtaatcatgg tcatagctgt 37 80 

ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 3840 

agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 3900 

tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 3960 

cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag 4020 

ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga 4080 

cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta ccattagcaa 4140 
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ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat 4200 

caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc 4260 

ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg 4320 

aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag 43 80 

agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt 4440 

aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct 4500 

atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac 4560 

gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata 4620 

atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa 4680 

cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag 4740 

atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg 4800 

ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc 4860 

*gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc 4920 

agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag 4980 

cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc 5040 

gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 5100 

agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 5160 

cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 5220 

ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 5280 

tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc 5340 

gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 5400 
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catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 5460 

cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 5520 

ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 5580 

cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 5640 

aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 5700 

gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 5760 

acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 5820 

ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 5880 

cagatccggt gcagattatt tggattgaga gtgaatatga gactctaatt ggataccgag 5940 

gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 6000 

accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 6060 

actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg 6120 

taaaacggct tgtcccgcgt catcggcggg ggtcataacg tgactccctt aattctccgc 6180 

tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata 6240 

ttggcgggta aacctaagag aaaagagcgt ttattagaat aatcggatat ttaaaagggc 6300 

gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga 6360 

tctggcgccg gccagcgaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc 6420 

gcccagcaca ggtgcgcagg caaattgcac caacgcatac agcgccagca gaatgccata 6480 

gtgggcggtg acgtcgttcg agtgaaccag atcgcgcagg aggcccggca gcaccggcat 6540 

aatcaggccg atgccgacag cgtcgagcgc gacagtgctc agaattacga tcaggggtat 6600 

gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa cgcgcggatt 6660 



WO 2004/063359 PCT/EP2004/000099 

218/357 



ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg 6720 

acaaagttgc agccgaatac agtgatccgt gccgccctgg acctgttgaa cgaggtcggc 6780 

gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt 6840 

tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc catgctggcg 6900 

gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg 6960 

aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc 7020 

ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc 7080 

gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact 7140 

gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc 7200 

gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt cgacgaagcc 7260 

ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg 7320 

aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg 7380 

ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc 7440 

accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc 7500 

aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc 7560 

tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7 620 

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7680 

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7740 

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7800 

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7860 

ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc 7920 
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gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc 7980 

gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg 8040 

cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact 8100 

gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct 8160 

accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag 8220 

ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag 82 80 

gcggcggcgg ccggcatgag cctgtcggbc tacctgctgg ccgtcggcca gggctacaaa 8340 

atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg 8400 

ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc 8460 

ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc 8520 

aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa 8580 

cggccggggg gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga 8640 

cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga 8700 

cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 8760 

cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt tgtggatacc 8820 

tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact tgaggggccg 8880 

actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg gcgacgtgga 8940 

gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc ccacagatga 9000 

tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc gcgactactg 9060 

acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga tgaggggcgc 9120 

acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc aagggtttcc 9180 
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gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca atatttataa 9240 

accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg aaggggggtg 9300 

cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc ccaggggctg 9360 

cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt ccttgccatt 9420 

gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc cggaagcatt 9480 

gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag tgagggcggc 9540 

ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga cttcatggcg 9600 

gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc cgtgctcgtg 9660 

ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt ataccgaggt 9720 

atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat ttaaaaagct 9780 

accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat attgacaata 9840 
ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga tttcaggggg 9900 
caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca taaaaacttg 9960 

catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt ctatcataat 10020 

tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc gatgactttg 10080 

tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg tgccaggtgc 10140 

tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct gattacgtgc 10200 

agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca tatcaccacg 10260 

tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg ttcaccgaat 10320 

acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca gcgctggcgc 10380 

gatttagccc cgacatagcc ccactgttcg tccatttccg cgcagacgat gacgtcactg 10440 
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cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga cgtaaaatcg 10500 

tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca ttcatggcca 10560 

tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac tgcagttgcc 1062 0 

atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt ttgccgttac 10680 

gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa gccactggag 10740 

cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc cataattgtg 10800 

gtttcaaaat cggctccgtc gatactatgt tatacgccaa ctttgaaaac aactttgaaa 10860 

aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg gagttcgtct 10920 

tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa ggaaataata 10980 

aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat accgctgcgt 11040 

aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa 11100 

cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg tggaacggga 11160 

aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga 11220 

acggcatgat ggctggagca atctgctcat gagtgaggcc gatggcgtcc tttgctcgga 11280 

agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag 11340 

gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag acagccgctt 11400 

agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg aaaactggga 11460 

agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga cggaaaagcc 11520 

cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct ttgtgaaaga 11580 

tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca agtggtatga 11640 

cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt atgtcgagct 11700 
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attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt atattttact 11760 

ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag caggagcgca 11820 

ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc aagtatttgg 11880 

gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac gagaaggacg 11940 

gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg gacaccaagg 12000 

caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc ggggcaatcc 12060 

cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa gaactgatcg 12120 

acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc atgcgtgcgc 12180 

cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc aagatcgagc 12240 

gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc gtggagcgtt 12300 

cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc gacacgcgag 12360 

gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa caggtcagcg 12420 

aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa atgcagcttt 12480 

ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc 12540 

gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg 12600 

tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag ctgcgggccg 12660 

acgatgacga actggtgtgg cagcaggtgfc tggagtacgc gaagcgcacc cctatcggcg 12720 

agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcaatggcc 12780 

ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca 12840 

cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg 12900 

accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt 12960 
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ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg tcgccgacgg 13020 

cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa 13080 

ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg 13140 

gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg 13200 

acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag 13260 

ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc 13320 

agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt 13380 

gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg 13440 

cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca 13500 

cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg 13560 

cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa 13620 

ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg 13680 

ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg 13740 

acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac ttaatatttc 13800 

gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg tcgcggcgac 13860 

ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc taggtagccc 13920 

gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg cgctgttggt 13980 

gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg cgggggcggt 14040 

ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 14100 

ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag ctttagtgtt 14160 

tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt ggctcggcct 14220 
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gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac tcgaacctac 14280 
agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc cggggatgca 14340 
tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag caatggatag 14400 
gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc ttcctcagcg 14460 
gctttatcca gcgatttcct attatgfccgg catagttctc aagatcgaca gcctgtcacg 14520 
gttaagcgag aaatgaataa gaaggctgat aattcggatc ectgcgaggg agatgatatt 14580 
tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc 14640 
atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc ggtaacatga 14700 
gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact gatgggctgc 14760 
ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 14820 
gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 14880 
cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg 14940 
cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc 15000 
aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat aaatcaaaag 15060 
aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga 15120 
acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg 15180 
aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc 15240 
ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg 15300 
aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg ggaagggcga 15360 
tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 15420 
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgaa 15480 
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ttcgagctcg gtacccgggg atctttcgac actgaaatac gtcgagcctg ctccgcttgg 15540 

aagcggcgag gagcctcgtc ctgtcacaac taccaacatg gagtacgata agggccagtt 15600 

ccgccagctc attaagagcc agttcatggg cgttggcatg atggccgtca tgcatctgta 15660 

cttcaagtac accaacgctc ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat 15720 

ctggttaaga tccacgtctt cgggaagcca gcgactggtg acctccagcg tccctttaag 15780 

gctgccaaca gctttctcag ccagggccag cccaagaccg acaaggcctc cctccagaac 15840 

gccgagaaga actggagggg tggtgtcaag gaggagtaag ctccttattg aagtcggagg 15900 

acggagcggt gtcaagagga tattcttcga ctctgtatta tagataagat gatgaggaat 15960 

tggaggtagc atagcttcat ttggatttgc tttccaggct gagactctag cttggagcat 16020 

agagggtcct ttggctttca atattctcaa gtatctcgag tttgaactta ttccctgtga 16080 

accttttatt caccaatgag cattggaatg aacatgaatc tgaggactgc aatcgccatg 16140 

aggttttcga aatacatccg gatgtcgaag gcttggggca cctgcgttgg ttgaatttag 16200 

aacgtggcac tattgatcat ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa 16260 

cgttgctagc agttccaggt ggaatgttat gatgagcatt gtattaaatc aggagatata 16320 

gcatgatctc tagttagctc accacaaaag tcagacggcg taaccaaaag tcacacaaca 16380 

caagctgtaa ggatttcggc acggctacgg aagacggaga agccaccttc agtggactcg 16440 

agtaccattt aattctattt gtgtttgat.c gagacctaat acagccccta caacgaccat 16500 

caaagtcgta tagctaccag tgaggaagtg gactcaaatc gacttcagca acatctcctg 16560 

gataaacttt aagcctaaac tatacagaat aagataggtg gagagcttat accgagctcc 16620 

caaatctgtc cagatcatgg ttgaccggtg cctggatctt cctatagaat catccttatt 16680 

cgttgaccta gctgattctg gagtgaccca gagggtcatg acttgagcct aaaatccgcc 16740 
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gcctccacca tttgtagaaa aatgtgacga actcgtgagc tctgtacagt gaccggtgac 16800 

tctttctggc atgcggagag acggacggac gcagagagaa gggctgagta ataagccact 16860 

ggccagacag ctctggcggc tctgaggtgc agtggatgat tattaatccg ggaccggccg 16920 

cccctccgcc ccgaagtgga aaggctggtg tgcccctcgt tgaccaagaa tctattgcat 16980 

catcggagaa tatggagctt catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc 17040 

aggggtgtat agccgtcggc gaaatagcat gccattaacc taggtacaga agtccaattg 17100 

cttccgatct ggtaaaagat tcacgagata gtaccttctc cgaagtaggt agagcgagta 17160 

cccggcgcgt aagctcccta attggcccat ccggcatctg tagggcgtcc aaatatcgtg 17220 

cctctcctgc tttgcccggt gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc 17280 

gcagaccggg aacacaagct ggcagtcgac ccatccggtg ctctgcactc gacctgctga 17340 

ggtccctcag tccctggtag gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg 17400 

ttgacaaggt cgttgcgtca gtccaacatt tgttgccata ttttcctgct ctccccacca 17460 

gctgctcttt tcttttctct ttcttttccc atcttcagta tattcatctt cccatccaag 17520 

aacctttatt tcccctaagt aagtactttg ctacatccat actccatcct tcccatccct 17580 

tattcctttg aacctttcag ttcgagcttt cccacttcat cgcagcttga ctaacagcta 17640 

ccccgcttga gcagacatca ccatgcctga actcaccgcg acgtctgtcg agaagtttct 17700 

gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 17760 

tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 17820 

tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 17880 

ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 17940 

acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 18000 
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cgcggaggcc atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggccc 18060 

attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 18120 

tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 18180 

gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 18240 

gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 18300 

tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 18360 

gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 18420 

gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 18480 

tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 18540 

aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 18600 

cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 18660 

tcgtccgagg gcaaaggaat agagtagatg ccgaccgcgg gatcgatcca cttaacgtta 18720 

ctgaaatcat caaacagctt gacgaatctg gatataagat cgttggtgtc gatgtcagct 18780 

ccggagttga gacaaatggt gttcaggatc tcgataagat acgttcattt gtccaagcag 18840 

caaagagtgc cttctagtga tttaatagct ccatgtcaac aagaataaaa cgcgttttcg 18900 

ggtttacctc ttccagatac agctcatctg caatgcatta atgcattgac tgcaacctag 18960 

taacgccttn caggctccgg cgaagagaag aatagcttag cagagctatt ttcattttcg 19020 

ggagacgaga tcaagcagat caacggtcgt caagagacct acgagactga ggaatccgct 19080 

cttggctcca cgcgactata tatttgtctc taattgtact ttgacatgct cctcttcttt 19140 

actctgatag cttgactatg aaaattccgt caccagcncc tgggttcgca aagataattg 19200 

catgtttctt ccttgaactc tcaagcctac aggacacaca ttcatcgtag gtataaacct 19260 
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cgaaatcant tcctactaag atggtataca atagtaacca tgcatggttg cctagtgaat 19320 

gctccgtaac acccaatacg ccggccgaaa cttttttaca actctcctat gagtcgttta 19380 

cccagaatgc acaggtacac ttgtttagag gtaatccttc tttctagcta gaagtcctcg 19440 

tgtactgtgt aagcgcccac tccacatctc cactcgacct gcaggcatgc a 19491 



<210> 46 

<211> 21300 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_f eature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 46 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 12 0 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 
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tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 138 0 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 
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tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 
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aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaapgaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttgaa ttcgagctcg gtacccgggg 4020 
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atctttcgac actgaaatac gtcgagcctg ctccgcttgg aagcggcgag gagcctcgtc 4080 

ctgtcacaac taccaacatg gagtacgata agggccagtt ccgccagctc attaagagcc 4140 

agttcatggg cgttggcatg atggccgtca tgcatctgta cttcaagtac accaacgctc 4200 

ttctgatcca gtcgatcatc cgctgaaggc gctttcgaat ctggttaaga tccacgtctt 4260 

cgggaagcca gcgactggtg acctccagcg tccctttaag gctgccaaca gctttctcag 4320 

ccagggccag cccaagaccg acaaggcctc cctccagaac gccgagaaga actggagggg 4380 

tggtgtcaag gaggagtaag ctccttattg aagtcggagg acggagcggt gtcaagagga 4440 

tattcttcga ctctgtatta tagataagat gatgaggaat tggaggtagc atagcttcat 4500 

ttggatttgc tttccaggct gagactctag cttggagcat agagggtcct ttggctttca 4560 

atattctcaa gtatctcgag tttgaactta ttccctgtga accttttatt caccaatgag 4620 

cattggaatg aacatgaatc tgaggactgc aatcgccatg aggttttcga aatacatccg 4680 

gatgtcgaag gcttggggca cctgcgttgg ttgaatttag aacgtggcac tattgatcat 4740 

ccgatagctc tgcaaagggc gttgcacaat gcaagtcaaa cgttgctagc agttccaggt 4800 

ggaatgttat gatgagcatt gtattaaatc aggagatata gcatgatctc tagttagctc 4860 

accacaaaag tcagacggcg taaccaaaag tcacacaaca caagctgtaa ggatttcggc 4920 

acggctacgg aagacggaga agccaccttc agtggactcg agtaccattt aattctattt 4980 

gtgtttgatc gagacctaat acagccccta caacgaccat caaagtcgta tagctaccag 5040 

tgaggaagtg gactcaaatc gacttcagca acatctcctg gataaacttt aagcctaaac 5100 

tatacagaat aagataggtg gagagcttat accgagctcc caaatctgtc cagatcatgg 5160 

ttgaccggtg cctggatctt cctatagaat catccttatt cgttgaccta gctgattctg 5220 

gagtgaccca gagggtcatg acttgagcct aaaatccgcc gcctccacca tttgtagaaa 5280 
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aatgtgacga actcgtgagc tctgtacagt gaccggtgac tctttctggc atgcggagag 5340 

acggacggac gcagagagaa gggctgagta ataagccact ggccagacag ctctggcggc 5400 

tctgaggtgc agtggatgat tattaatccg ggaccggccg cccctccgcc ccgaagtgga 5460 

aaggctggtg tgcccctcgt tgaccaagaa tctattgcat catcggagaa tatggagctt 5520 

catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc aggggtgtat agccgtcggc 5580 

gaaatagcat gccattaacc taggtacaga agtccaattg cttccgatct ggtaaaagat 5640 

tcacgagata gtaccttctc cgaagtaggt agagcgagta cccggcgcgt aagctcccta 5700 

attggcccat ccggcatctg tagggcgtcc aaatatcgtg cctctcctgc tttgcccggt 5760 

gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc gcagaccggg aacacaagct 5820 

ggcagtcgac ccatccggtg ctctgcactc gacctgctga ggtccctcag tccctggtag 5880 

gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg ttgacaaggt cgttgcgtca 5940 

gtccaacatt tgttgccata ttttcctgct ctccccacca gctgctcttt tcttttctct 6000 

ttcttttccc atcttcagta tattcatctt cccatccaag aacctttatt tcccctaagt 6060 

aagtactttg ctacatccat actccatcct tcccatccct tattcctttg aacctttcag 6120 

ttcgagcttt cccacttcat cgcagcttga ctaacagcta ccccgcttga gcagacatca 6180 

ccatgtcaat actcacttat ctggaatttc atctctacta tacactacct gtccttgcgg 6240 

cattgtgttg gctgctaaag ccgtttcact cacagcaaga caatctcaag tataaatttt 6300 

taatgttgat ggccgcctct accgcatcga tttgggacaa ttatatcgtt tatcatcgcg 6360 

cttggtggta ctgtcctact tgtgttgtgg ctgtcattgg ctatgtacct ctagaagaat 642 0 

acatgttctt tatcatcatg actttaatga ctgtcgcgtt ctcaaacttt gttatgcgtt 6480 

ggcacttgca tactttcttt attagaccca acacttcttg gaagcaaaca ctattagtac 6540 
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gccttgtgcc tgtttcagct ttattggcaa tcacttatca tgcttggcac ttgacactgc 6600 

caaataaacc ttcattttat ggttcatgca tcctttggta tgcttgtcct gtgttggcta 6660 

ttctttggct gggtgctggc gaatatatct tgcgtcgacc tgtggctgtc cttttgtcta 6720 

ttgttatccc tagtgtatac ctatgttggg ctgatatcgt cgctattagt gctggcacat 6780 

ggcatatttc tcttagaaca agcactggca aaatggtagt acccgattta cctgtagaag 6840 

aatgcctgtt ttttactttg atcaacacag tcttggtttt tgctacctgt gctatagacc 6900 

gcgctcaggc catcctccat gtgagcgcgc gtaatacgac tcactatagg gcgaattgga 6960 

gctccaccgc ggtggcggcc gctctagaac tagtggatcc cccgggctgc aggaattcgg 7020 

cacgagctac atttcacaag cccgtgagcg gtgcaagcgc tctgccccac atcggcccac 7080 

ctcctcatct ccatcggtca tttgctgcta ccacgatgct gtcgaagctg cagtcaatca 7140 

gcgtcaaggc ccgccgcgtt gaactagccc gcgacatcac gcggcccaaa gtctgcctgc 7200 

atgctcagcg gtgctcgtta gttcggctgc gagtggcagc accacagaca gaggaggcgc 7260 

tgggaaccgt gcaggctgcc ggcgcgggcg atgagcacag cgccgatgta gcactccagc 7320 

agcttgaccg ggctatcgca gagcgtcgtg cccggcgcaa acgggagcag ctgtcatacc 7380 

aggctgccgc cattgcagca tcaattggcg tgtcaggcat tgccatcttc gccacctacc 7440 

tgagatttgc catgcacatg accgtgggcg gcgcagtgcc atggggtgaa gtggctggca 7500 
ctctcctctt ggtggttggt ggcgcgctqg gcatggagat gtatgcccgc tatgcacaca 7560 
aagccatctg gcatgagtcg cctctgggct ggctgctgca caagagccac cacacacctc 7620 
gcactggacc ctttgaagcc aacgacttgt ttgcaatcat caatggactg cccgccatgc 7680 
tcctgtgtac ctttggcttc tggctgccca acgtcctggg ggcggcctgc tttggagcgg 7740 
ggctgggcat cacgctatac ggcatggcat atatgtttgt acacgatggc ctggtgcaca 7800 
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ggcgctttcc caccgggccc atcgctggcc tgccctacat gaagcgcctg acagtggccc 7860 

accagctaca ccacagcggc aagtacggtg gcgcgccctg gggtatgttc ttgggtccac 7920 

aggagctgca gcacattcca ggtgcggcgg aggaggtgga gcgactggtc ctggaactgg 7980 

actggtccaa gcgggctcag gccatcctcc atctgtacaa atcatctgtt caaaatcaaa 8040 

accctaaaca agccatttcc cttttccagc atgtcaaaga gctagcatgg gccttctgtc 8100 

ttcctgacca aatgctcaac aatgaattgt ttgatgatct tactatcagc tgggatattt 8160 

tacgtaaagc ctcaaagtca ttctatactg catctgccgt ttttccaagt tatgtacgtc 8220 

aagacttggg tgttctctat gctttctgca gagctaccga tgacctgtgc gatgatgaat 82 80 

ccaaatctgt tcaagaaaga agagaccaat tagatcttac tcgacaattt gttcgtgatc 8340 

tctttagcca aaagaccagt gcgcctattg tgattgattg ggaattgtat caaaaccaac 8400 

ttcctgcttc ttgtatatca gcctttagag cctttactcg ccttcgccat gtccttgaag 8460 

tagaccctgt agaagaacta ttagatggtt acaaatggga tcttgagcgt cgtcctatcc 8520 

ttgatgaaca agacttggag gcatactctg cttgtgtggc cagtagtgtg ggtgaaatgt 8580 

gcacacgtgt gattcttgct caagaccaaa aggaaaatga tgcttggata attgaccgtg 8640 

cacgtgagat ggggctggtg ctacaatacg ttaacattgc tcgagacatt gtgactgata 8700 

gcgagactct gggtcgatgt tatctgcctc aacaatggct tagaaaagaa gaaacagaac 8760 

aaatacagca aggcaacgcc cgtagcctag gtgatcaaag actgttgggc ttgtctctga 8820 

agcttgtagg aaaggcagac gctatcatgg tgagagctaa gaagggcatt gacaagttgc 8880 

cggcaaactg tcaaggcggt gtacgagctg cttgccaagt atatgctgca attggatctg 8940 

tactcaagca gcagaagaca acatatccta caagagctca tctaaaagga agcgaacgtg 9000 

ccaagattgc tctgttgagt gtatacaacc tctatcaatc tgaagacaag cctgtggctc 9060 
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tccgtcaagc tagaaagatt aagagttttt ttgttgatta gtgaattttt gttttattta 9120 

tgtctgatag ttcaataaag agacaacaca tacaatataa aatcattgtc tttaaatgtt 9180 

aatttagtag agtgtaaagc ctgcattttt tttgtacgca taaacaatga gttcaccccg 9240 

cttctggttt ttaaataatt atgtcaaact agggaaaatt cttttttttc tcttcgttct 9300 

ttttttggct tgttgtggag tcacaggctt gtctfccagat tgatagaggt tgtatacact 9360 

caacagagca atcttggcac gttcgcttcc ttttagatga gctcttgtag gatatgttgt 9420 

cttctgctgc ttgagtacag atccaattgc agcatatact tggcaagcag ctcgtacacc 9480 

gccttgacag tttgccggca acttgtcaat gcccttctta gctctcacca tgatagcgtc 9540 

tgcctttcct acaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 9600 

tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 9660 

ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 9720 

aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 9780 

tattgggcca aagacaaaag, ggcgacattc aaccgattga gggagggaag gtaaatattg 9840 

acggaaatta ttcattaaag gtgaattatc accgtcaccg acttgagcca tttgggaatt 9900 
agagccagca aaatcaccag tagcaccatt accattagca aggccggaaa cgtcaccaat 9960 

gaaaccatcg atagcagcac cgtaatcagt agcgacagaa tcaagtttgc ctttagcgtc 10020 

agactgtagc gcgttttcat cggcattttc ggtcatagcc cccttattag cgtttgccat 10080 

cttttcataa tcaaaatcac cggaaccaga gccaccaccg gaaccgcctc cctcagagcc 10140 

gccaccctca gaaccgccac cctcagagcc accaccctca gagccgccac cagaaccacc 10200 

accagagccg ccgccagcat tgacaggagg cccgatctag taacatagat gacaccgcgc 10260 

gcgataattt atcctagttt gcgcgctata ttttgttttc tatcgcgtat taaatgtata 10320 
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attgcgggac tctaatcata aaaacccatc tcataaataa cgtcatgcat tacatgttaa 10380 

ttattacatg cttaacgtaa ttcaacagaa attatatgat aatcatcgca agaccggcaa 10440 

caggattcaa tcttaagaaa ctttattgcc aaatgtttga acgatcgggg atcatccggg 10500 

tctgtggcgg gaactccacg aaaatatccg aacgcagcaa gatatcgcgg tgcatctcgg 10560 

tcttgcctgg gcagtcgccg ccgacgccgt tgatgtggac gccgggcccg atcatattgt 10620 

cgctcaggat cgtggcgttg tgcttgtcgg ccgttgctgt cgtaatgata tcggcacctt 10680 

cgaccgcctg ttccgcagag atcccgtggg cgaagaactc cagcatgaga tccccgcgct 10740 

ggaggatcat ccagccggcg tcccggaaaa cgattccgaa gcccaacctt tcatagaagg 10800 

cggcggtgga atcgaaatct cgtgatggca ggttgggcgt cgcttggtcg gtcatttcga 10860 

accccagagt cccgctcaga agaactcgtc aagaaggcga tagaaggcga tgcgctgcga 10920 

atcgggagcg gcgataccgt aaagcacgag gaagcggtca gcccattcgc cgccaagctc 10980 

ttcagcaata tcacgggtag ccaacgctat gtcctgatag cggtccgcca cacccagccg 11040 

gccacagtcg atgaatccag aaaagcggcc attttccacc atgatattcg gcaagcaggc 11100 

atcgccatgg gtcacgacga gatcatcgcc gtcgggcatg cgcgccttga gcctggcgaa 11160 

cagttcggct ggcgcgagcc cctgatgctc ttcgtccaga tcatcctgat cgacaagacc 11220 

ggcttccatc cgagtacgtg ctcgctcgat gcgatgtttc gcttggtggt cgaatgggca 11280 

ggtagccgga tcaagcgtat gcagccgccg cattgcatca gccatgatgg atactttctc 11340 

ggcaggagca aggtgagatg acaggagatc ctgccccggc acttcgccca atagcagcca 11400 

gtcccttccc gcttcagtga caacgtcgag cacagctgcg caaggaacgc ccgtcgtggc 11460 

cagccacgat agccgcgctg cctcgtcctg cagttcattc agggcaccgg acaggtcggt 11520 

cttgacaaaa agaaccgggc gcccctgcgc tgacagccgg aacacggcgg catcagagca 11580 
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gccgattgtc tgttgtgccc agtcatagcc gaatagcctc tccacccaag cggccggaga 11640 

acctgcgtgc aatccatctt gttcaatcat gcgaaacgat ccagatccgg tgcagattat 11700 

ttggattgag agtgaatatg agactctaat tggataccga ggggaattta tggaacgtca 11760 

gtggagcatt tttgacaaga aatatttgct agctgatagt gaccttaggc gacttttgaa 11820 

cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa acccgcggct 11880 

gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc ttgtcccgcg 11940 

tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca gattgtcgtt 12000 

tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt aaacctaaga 12060 

gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg tttatccgtt 12120 

cgtccatttg tatgtgcatg ccaaccacag ggttccccag atctggcgcc ggccagcgag 12180 

acgagcaaga ttggccgccg cccgaaacga tccgacagcg cgcccagcac aggtgcgcag 12240 

gcaaattgca ccaacgcata cagcgccagc agaatgccat agtgggcggt gacgtcgttc 12300 

gagtgaacca gatcgcgcag gaggcccggc agcaccggca taatcaggcc gatgccgaca 12360 

gcgtcgagcg cgacagtgct cagaattacg atcaggggta tgttgggttt cacgtctggc 12420 

ctccggacca gcctccgctg gtccgattga acgcgcggat tctttatcac tgataagttg 12480 

gtggacatat tatgtttatc agtgataaag tgtcaagcat gacaaagttg cagccgaata 12540 

cagtgatccg tgccgccctg gacctgttga acgaggtcgg cgtagacggt ctgacgacac 12600 

gcaaactggc ggaacggttg ggggttcagc agccggcgct ttactggcac ttcaggaaca 12660 
agcgggcgct gctcgacgca ctggccgaag ccatgctggc ggagaatcat acgcattcgg 12720 
tgccgagagc cgacgacgac tggcgctcat ttctgatcgg gaatgcccgc agcttcaggc 12780 
aggcgctgct cgcctaccgc gatggcgcgc gcatccatgc cggcacgcga ccgggcgcac 12 840 
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cgcagatgga aacggccgac gcgcagcttc gcttcctctg cgaggcgggt ttttcggccg 12900 

gggacgccgt caatgcgctg atgacaatca gctacttcac tgttggggcc gtgcttgagg 12960 

agcaggccgg cgacagcgat gccggcgagc gcggcggcac cgttgaacag gctccgctct 13020 

cgccgctgtt gcgggccgcg atagacgcct tcgacgaagc cggtccggac gcagcgttcg 13080 

agcagggact cgcggtgatt gtcgatggat tggcgaaaag gaggctcgtt gtcaggaacg 13140 

ttgaaggacc gagaaagggt gacgattgat caggaccgct gccggagcgc aacccactca 13200 

ctacagcaga gccatgtaga caacatcccc tccccctttc caccgcgtca gacgcccgta 13260 

gcagcccgct acgggctttt tcatgccctg ccctagcgtc caagcctcac ggccgcgctc 13320 

ggcctctctg gcggccttct ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 13380 

ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 13440 

agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 13500 

ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 13560 

caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 13620 

gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 13 680 

cctgtccgcc tttctccctt cgggaagcgt ggcgcttttc cgctgcataa ccctgcttcg 13740 

gggtcattat agcgattttt tcggtatatc catccttttt cgcacgatat acaggatttt 13800 

gccaaagggt tcgtgtagac tttccttggt gtatccaacg gcgtcagccg ggcaggatag 13860 

gtgaagtagg cccacccgcg agcgggtgtt ccttcttcac tgtcccttat tcgcacctgg 13920 

cggtgctcaa cgggaatcct gctctgcgag gctggccggc taccgccggc gtaacagatg 13980 

agggcaagcg gatggctgat gaaaccaagc caaccaggaa gggcagccca cctatcaagg 14040 

tgtactgcct tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg gccggcatga 14100 
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gcctgtcggc ctacctgctg gccgtcggcc agggctacaa aatcacgggc gtcgtggact 14160 

atgagcacgt ccgcgagctg gcccgcatca atggcgacct gggccgcctg ggcggcctgc 14220 

tgaaactctg gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc acgatcctcg 14280 

ccctgctggc gaagatcgaa gagaagcagg acgagcttgg caaggtcatg atgggcgtgg 14340 

tccgcccgag ggcagagcca tgactttttt agccgctaaa acggccgggg ggtgcgcgtg 14400 

attgccaagc acgtccccat gcgctccatc aagaagagcg acttcgcgga gctggtgaag 14460 

tacatcaccg acgagcaagg caagaccgag cgcctttgcg acgctcaccg ggctggttgc 14520 

cctcgccgct gggctggcgg ccgtctatgg ccctgcaaac gcgccagaaa cgccgtcgaa 14580 

gccgtgtgcg agacaccgcg gccgccggcg ttgtggatac ctcgcggaaa acttggccct 14640 

cactgacaga tgaggggcgg acgttgacac ttgaggggcc gactcacccg gcgcggcgtt 14700 

gacagatgag gggcaggctc gatttcggcc ggcgacgtgg agctggccag cctcgcaaat 14760 

cggcgaaaac gcctgatttt acgcgagttt cccacagatg atgtggacaa gcctggggat 14820 

aagtgccctg cggtattgac acttgagggg cgcgactact gacagatgag gggcgcgatc 14880 

cttgacactt gaggggcaga gtgctgacag atgaggggcg cacctattga catttgaggg 14940 

gctgtccaca ggcagaaaat ccagcatttg caagggtttc cgcccgtttt tcggccaccg 15000 

ctaacctgtc ttttaacctg cttttaaacc aatatttata aaccttgttt ttaaccaggg 15060 

ctgcgccctg tgcgcgtgac cgcgcacgcc gaaggggggt gccccccctt ctcgaaccct 15120 

cccggcccgc taacgcgggc ctcccatccc cccaggggct gcgcccctcg gccgcgaacg 15180 

gcctcacccc aaaaatggca gcgctggcag tccttgccat tgccgggatc ggggcagtaa 15240 

cgggatgggc gatcagcccg agcgcgacgc ccggaagcat tgacgtgccg caggtgctgg 15300 

catcgacatt cagcgaccag gtgccgggca gtgagggcgg cggcctgggt ggcggcctgc 15360 
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ccttcacttc ggccgtcggg gcattcacgg acttcatggc ggggccggca atttttacct 15420 

tgggcattct tggcatagtg gtcgcgggtg ccgtgctcgt gttcgggggt gcgataaacc 15480 

cagcgaacca tttgaggtga taggtaagat tataccgagg tatgaaaacg agaattggac 15540 

ctttacagaa ttactctatg aagcgccata tttaaaaagc tacgaagacg aagaggatga 15600 

agaggatgag gaggcagatt gccttgaata tattgacaat actgataaga taatatatct 15660 

tttatataga agatatcgcc gtatgtaagg atttcagggg gcaaggcata ggcagcgcgc 15720 

ttatcaatat atctatagaa tgggcaaagc ataaaaactt gcatggacta atgcttgaaa 15780 

cccaggacaa taaccttata gcttgtaaat tctatcataa ttgggtaatg actccaactt 15840 

attgatagtg ttttatgttc agataatgcc cgatgacttt gtcatgcagc tccaccgatt 15900 

ttgagaacga cagcgacttc cgtcccagcc gtgccaggtg ctgcctcaga ttcaggttat 15960 

gccgctcaat tcgctgcgta tatcgcttgc tgattacgtg cagctttccc ttcaggcggg 16020 

attcatacag cggccagcca tccgtcatcc atatcaccac gtcaaagggt gacagcaggc 16080 

tcataagacg ccccagcgtc gccatagtgc gttcaccgaa tacgtgcgca acaaccgtct 16140 

tccggagact gtcatacgcg taaaacagcc agcgctggcg cgatttagcc ccgacatagc 16200 

cccactgttc gtccatttcc gcgcagacga tgacgtcact gcccggctgt atgcgcgagg 162 60 

ttaccgactg cggcctgagt tttttaagtg acgtaaaatc gtgttgaggc caacgcccat 16320 

aatgcgggct gttgcccggc atccaacgce attcatggcc atatcaatga ttttctggtg 16380 

cgtaccgggt tgagaagcgg tgtaagtgaa ctgcagttgc catgttttac ggcagtgaga 16440 

gcagagatag cgctgatgtc cggcggtgct tttgccgtta cgcaccaccc cgtcagtagc 16500 

tgaacaggag ggacagctga tagacacaga agccactgga gcacctcaaa aacaccatca 16560 

tacactaaat cagtaagttg gcagcatcac ccataattgt ggtttcaaaa tcggctccgt 16620 
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cgatactatg ttatacgcca actttgaaaa caactttgaa aaagctgttt tctggtattt 16680 

aaggttttag aatgcaagga acagtgaatt ggagttcgtc ttgttataat tagcttcttg 16740 

gggtatcttt aaatactgta gaaaagagga aggaaataat aaatggctaa aatgagaata 16800 

tcaccggaat tgaaaaaact gatcgaaaaa taccgctgcg taaaagatac ggaaggaatg 16860 

tctcctgcta aggtatataa gctggtggga gaaaatgaaa acctatattt aaaaatgacg 16920 

gacagccggt ataaagggac cacctatgat gtggaacggg aaaaggacat gatgctatgg 16980 

ctggaaggaa agctgcctgt tccaaaggtc ctgcactttg aacggcatga tggctggagc 17040 

aatctgctca tgagtgaggc cgatggcgtc ctttgctcgg aagagtatga agatgaacaa 17100 

agccctgaaa agattatcga gctgtatgcg gagtgcatca ggctctttca ctccatcgac 17160 

atatcggatt gtccctatac gaatagctta gacagccgct tagccgaatt ggattactta 17220 

ctgaataacg atctggccga tgtggattgc gaaaactggg aagaagacac tccatttaaa 17280 

gatccgcgcg agctgtatga ttttttaaag acggaaaagc ccgaagagga acttgtcttt 17340 

tcccacggcg acctgggaga cagcaacatc tttgtgaaag atggcaaagt aagtggcttt 17400 

attgatcttg ggagaagcgg cagggcggac aagtggtatg acattgcctt ctgcgtccgg 17460 

tcgatcaggg aggatatcgg ggaagaacag tatgtcgagc tattttttga cttactgggg 17520 

atcaagcctg attgggagaa aataaaatat tatattttac tggatgaatt gttttagtac 17580 

ctagatgtgg cgcaacgatg ccggcgacaa gcaggagcgc accgacttct tccgcatcaa 17640 

gtgttttggc tctcaggccg aggcccacgg caagtatttg ggcaaggggt cgctggtatt 17700 

cgtgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg tctacgggac 17760 

cgacttcatt gccgataagg tggattatct ggacaccaag gcaccaggcg ggtcaaatca 17820 

ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag ggtgaatgaa 17880 
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tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt tttccgccga 17940 

ggatgccgaa accatcgcaa gccgcaccgt catgcgtgcg ccccgcgaaa ccttccagtc 18000 

cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg tgcaactggc 18060 

tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgtc tcgaacagga 18120 

ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga cgaccaagaa 18180 

gcgaaaaacc gccggcgagg acctggcaaa acaggtcagc gaggccaagc aggccgcgtt 18240 

gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg atattgcgcc 18300 

gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc tgttcaccac 18360 

gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc acgtcaacaa 18420 

ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg aactggtgtg 18480 

gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca ccttcacgtt 18540 

ctacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca cgaaggccga 18600 

ggaatgcctg tcgcgcctac aggcgacggc gatgggcttc acgtccgacc gcgttgggca 18660 

cctggaatcg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca agaaaacgtc 18720 

ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg accactacac 18780 

gaaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga tgttcgacta 18840 

tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc tcatgtgcgg 18900 

atcggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct gcgaagagtt 18960 

gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc attgcaaacg 19020 

ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt tactggcatt 19080 

tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct cgggacgcac 19140 
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ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt gattaaggct 19200 

cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg attgtcggcc 19260 

ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa aaagcccatg 19320 

gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat cgacggcgag 19380 

atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca caaggcgcat 19440 

ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg tatgctgctg 19500 

cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc aacgggaatc 19560 

tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg gagcttgttg 19620 

tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg 19680 

ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgatacgatt gatggcggtc 19740 

ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg 19800 

ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc 19860 

gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg 19920 

gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg 19980 

cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc gggtttaacc 2 0040 
tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc 20100 
tttctcagcc ccagatctgg ggtcgatcag ccggggatgc atcaggccga cagtcggaac 20160 
ttcgggtccc cgacctgtac cattcggtga gcaatggata ggggagttga tatcgtcaac 20220 
gttcacttct aaagaaatag cgccactcag cttcctcagc ggctttatcc agcgatttcc 20280 
tattatgtcg gcatagttct caagatcgac agcctgtcac ggttaagcga gaaatgaata 20340 
agaaggctga taattcggat ctctgcgagg gagatgatat ttgatcacag gcagcaacgc 20400 
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tctgtcatcg ttacaatcaa catgctaccc 

cagcttagtt gccgttcttc cgaatagcat 

aacggctctc ccgctgacgc cgtcccggac 

tgtgccgagc tgccggtcgg ggagctgttg 

aaacaaattg acgcttagac aacttaataa 

tggtttttct tttcaccagt gagacgggca 

gagagagttg cagcaagcgg tccacgctgg 

tggtggttcc gaaatcggca aaatccctta 

gagtgttgtt ccagtttgga acaagagtcc 

agggcgaaaa accgtctatc agggcgatgg 

ttttttgggg tcgaggtgcc gtaaagcact 

tagagcttga cggggaaagc cggcgaacgt 

agcgggcgcc attcaggctg cgcaactgtt 

tattacgcca gctggcgaaa gggggatgtg 

ggttttccca gtcacgacgt tgtaaaacga 

<210> 47 
<211> 17756 
<212> DNA 
<213> Artificial 

<220> 

<223> Plasmid 
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tccgcgagat catccgtgtt tcaaacccgg 20460 

cggtaacatg agcaaagtct gccgccttac 20520 

tgatgggctg cctgtatcga gtggtgattt 20580 

gctggctggt ggcaggatat attgtggtgt 20640 

cacattgcgg acgtttttaa tgtactgggg 20700 

acagctgatt gcccttcacc gcctggccct 20760 

tttgccccag caggcgaaaa tcctgtttga 20820 

taaatcaaaa gaatagcccg agatagggtt 20880 

actattaaag aacgtggact ccaacgtcaa 20940 

cccactacgt gaaccatcac ccaaatcaag 21000 

aaatcggaac cctaaaggga gcccccgatt 21060 

ggcgagaaag gaagggaaga aagcgaaagg 21120 

gggaagggcg atcggtgcgg gcctcttcgc 21180 

ctgcaaggcg attaagttgg gtaacgccag 21240 

cggccagtga attcgagctc ggtacccggg 213 00 



<220> 
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<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 
<222> (10472) . . (10472) 

<223> n is a, c, g, or t 



<220> 

< 2 2 1 > mi s c_f ea t ur e 
<222> (10563) . . (10563) 
<223> n is a, c, g, or t 

<400> 47 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 



ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 



840 
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ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca .ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgcoc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 
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aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 
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gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc- tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 
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gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg . 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 552 0 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 
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caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 
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aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 
accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 
acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 
cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 
agaatatgga get teat cga atcaccggca gtaagcgaag gagaatgtga agecaggggt 8340 
gtatagccgt eggegaaata geatgecatt aacctaggta cagaagtcca attgettccg 8400 
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atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttfctctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgctfct gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
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gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt cattttgctt 10800 

tgtaaatttc tggtaactgc caccaagaaa tatgaggata ttcgtgatgt tcctcgtggt 10860 

agccaaaatg atagcacgtg ataaatgacc accaaatagg acggctaatt gtttgggcac 10920 
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aatgaggctg aacataaccc cctattggtt cactatgggg taaaaaagta ccaaaataga 10980 

ataattgtaa tgaacttaaa agcgagggta gcacccaaaa gtaagttaga ttatcacttg 11040 

ggatatggag tatgtattta gcaaagttat aaataatagt caacgcaatt atttgccccc 11100 

aactccagta acctttcata aaatgaaaat accaagcaaa gaaactttgg tgtttaccat 11160 

tgtgaaaatc cgggtcfcatt gagcttgctg gattgtggtg gtgtaaccaa tgttttttca 11220 

atagtttttg atatggtaaa agaccataaa gggatagggt caatgttcca atcaaatgat 11280 

taatcttggt gttttgggga aatactacgc catgcatggc atcatgagat gtaataaata 11340 

atcccgtata taaaaatgtt tgccatagta taacaggcaa taacatccaa aattttagct 11400 

ttgagatgtc aagggaaagt aataaactca ggctaatgac ccatgcgcta acaatgacaa 11460 

tagcaatgaa aagcccctta aactgagatt tacttctcag tactggagtc agttttgctt 11520 

gatgactgag tggttgttct aactggatca tttctaaaga gaaggtggaa caatgttagc 11580 

ataattgtgc ttgagtgagg actttgaggg taggtacata cttgataaag ttaatgatta 11640 

aagagaaaaa aaaagttttg gttcaaagca gaaattgttt tttaaatcga ttggtgagaa 11700 

aatttttttc tgtttccgca tcaccaaagc cacctcagga atggtcacaa attattggtc 11760 

tgattggacc ataagcatac aaaaagttca ttgaagtata cttagtggct tattagactt 11820 

ttatcgtttt ctaacgcgaa tcagcaatgt ttcttgtttg atttactgct tgctttagat 11880 

catttttgtc tgaaatatta tgcatttgtt caaagcggcc tttgtttcct ttctttcatg 11940 

cttaaacacg ttgtttattc catatattac tttgaatatg catcaccgca aagcggaagt 12000 

gcaaaataac aaagaacctc tttgggttac acgatcaact gctattgtga aaaaaatttc 12060 

tttttgaaaa tttttggaat aatatctctt gcaaaaaaga aattttgtat atttagtagc 12120 

atcaagaaca aatgaaagaa gtgtgggata acaagaatac atcatcttta gacaaaagta 12180 
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cgagaaaaat ctaataagtt gttatagagg tctttgtttt ctttgtgttt atagacagtt 12240 

atttagagtt tgaaaagtgt ctctaatgtg tcttttttta ttattattat ttcaaatgtt 12300 

atgtaatata gctaaagcta tagatttgac attttttcta aatataaaat ttcagtcaac 12360 

agaaataaat gacacgagtt ctttttctct ctctcaatcc tgttgatcat caatctttga 12420 

tgtcgtttta aaacaaatga atggcattta gttccttagg tgtcactcac atcttgttga 12480 

ccagaaaatc cttattcgcc ctcaaatctg ctttattcct ttcatttgat ttgatgttta 12540 

agtaatgcaa gcaaacaaaa aagaaacctt tcttgcaaag acaaaagaat tgttttcaga 12600 

ggaaagcaac tcgttgtcat tttttaagga tttagactta taatcgacac catagtttgt 12660 

ccgttacatt ttttattgtc gttttctgat ttccttttaa tctttaagca aaatcaatat 12720 

taacttatct tgtcttccaa taaaaaatgg ataccaataa caataaatcc ttcacaaaga 12780 

aaaaaaaaaa aaactcgaaa aaagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 12840 

aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 12900 

ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 12960 

ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 13020 

cggtttgcgt attgggccaa agacaaaagg gcgacattca accgattgag ggagggaagg 13080 

taaatattga cggaaattat tcattaaagg tgaattatca ccgtcaccga cttgagccat 13140 

ttgggaatta gagccagcaa aatcaccag.t agcaccatta ccattagcaa ggccggaaac 13200 

gtcaccaatg aaaccatcga tagcagcacc gtaatcagta gcgacagaat caagtttgcc 13260 

tttagcgtca gactgtagcg cgttttcatc ggcattttcg gtcatagccc ccttattagc 13320 

gtttgccatc ttttcataat caaaatcacc ggaaccagag ccaccaccgg aaccgcctcc 13380 

ctcagagccg ccaccctcag aaccgccacc ctcagagcca ccaccctcag agccgccacc 13440 
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agaaccacca ccagagccgc cgccagcatt gacaggaggc ccgatctagt aacatagatg 13500 

acaccgcgcg cgataattta tcctagtttg cgcgctatat tttgttttct atcgcgtatt 13560 

aaatgtataa ttgcgggact ctaatcataa aaacccatct cataaataac gtcatgcatt 13620 

acatgttaat tattacatgc ttaacgtaat tcaacagaaa ttatatgata atcatcgcaa 13680 

gaccggcaac aggattcaat cttaagaaac tttattgcca aatgtttgaa cgatcgggga 13740 

tcatccgggt ctgtggcggg aactccacga aaatatccga acgcagcaag atatcgcggt 13800 

gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt gatgtggacg ccgggcccga 13860 

tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc cgttgctgtc gtaatgatat 13920 

cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc gaagaactcc agcatgagat 13980 

ccccgcgctg gaggatcatc cagccggcgt cccggaaaac gattccgaag cccaaccttt 14040 

catagaaggc ggcggtggaa tcgaaatctc gtgatggcag gttgggcgtc gcttggtcgg 14100 

tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat 14160 

gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 14220 

gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 14280 

acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 14340 

caagcaggca tcgccatggg tcacgacgag atcatcgccg tcgggcatgc gcgccttgag 14400 

cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc 14460 

gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc 14520 

gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga 14580 

tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa 14640 

tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc 14700 
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cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agt teat tea gggcaccgga 14760 

caggteggtc ttgacaaaaa gaaccgggcg cccctgcgct gaeagcegga acacggcggc 14820 

atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagectet ccacccaagc 14880 

ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc cagatceggt 14940 

gcagattatt tggattgaga gtgaafcatga gactctaatt ggataccgag gggaatttat 15000 

ggaacgtcag tggagcattt ttgacaagaa atatttgeta gctgatagtg accttaggcg 15060 

acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa actccagaaa 15120 

cccgcggctg agtggctcct tcaacgttgc ggttctgtca gttccaaacg taaaaegget 15180 

tgtcccgcgt categgeggg ggtcataacg tgactccctt aattctccgc tcatgatcag 15240 

attgtcgttt cccgccttca gtttaaacta tcagtgtttg acaggatata ttggcgggta 15300 

aacctaagag aaaagagcgt ttattagaat aateggatat ttaaaagggc gtgaaaaggt 15360 

ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttccccaga tctggcgccg 1542 0 

gecagegaga cgagcaagat tggccgccgc ccgaaacgat ccgacagcgc gcccagcaca 15480 

ggtgcgcagg caaattgeae caacgcatac agcgccagca gaatgecata gtgggcggtg 15540 

aegtegtteg agtgaaccag ategegcagg aggcccggca gcaccggcat aatcaggccg 15600 

atgccgacag cgtcgagcgc gaeagtgetc agaattacga tcaggggtat gttgggtttc 15660 

acgtctggcc tccggaccag cctccgctgg tccgattgaa cgegeggatt ctttatcact 15720 
gataagttgg tggacatatt atgtttatca gtgataaagt gtcaagcatg acaaagttgc 15780 
agecgaatae agtgatccgt gccgccctgg acctgttgaa egaggtegge gtagacggtc 15840 
tgacgacacg caaactggcg gaacggttgg gggttcagca gccggcgctt tactggcact 15900 
tcaggaacaa gcgggcgctg ctcgacgcac tggecgaage catgctggcg gagaatcata 15960 
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cgcattcggt gccgagagcc gacgacgact ggcgctcatt tctgatcggg aatgcccgca 16020 

gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg catccatgcc ggcacgcgac 16080 

cgggcgcacc gcagatggaa acggccgacg cgcagcttcg cttcctctgc gaggcgggtt 16140 

tttcggccgg ggacgccgtc aatgcgctga tgacaatcag ctacttcact gttggggccg 16200 

tgcttgagga gcaggccggc gacagcgatg ccggcgagcg cggcggcacc gttgaacagg 16260 

ctccgctcte gccgctgttg cgggccgcga tagacgcctt cgacgaagcc ggtccggacg 16320 

cagcgttcga gcagggactc gcggtgattg tcgatggatt ggcgaaaagg aggctcgttg 16380 

tcaggaacgt tgaaggaccg agaaagggtg acgattgatc aggaccgctg ccggagcgca 16440 

acccactcac tacagcagag ccatgtagac aacatcccct ccccctttcc accgcgtcag 16500 

acgcccgtag cagcccgcta cgggcttttt catgccctgc cctagcgtcc aagcctcacg 16560 

gccgcgctcg gcctctctgg cggccttctg gcgctcttcc gcttcctcgc tcactgactc 16620 

gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 16680 

gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 16740 

ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 16800 

cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 16860 

ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 16920 

taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgcttttcc gctgcataac 16980 

cctgcttcgg ggtcattata gcgatttttt cggtatatcc atcctttttc gcacgatata 17040 

caggattttg ccaaagggtt cgtgtagact ttccttggtg tatccaacgg cgtcagccgg 17100 

gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc cttcttcact gtcccttatt 17160 

cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg ctggccggct accgccggcg 17220 
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taacagatga gggcaagcgg atggctgatg aaaccaagcc aaccaggaag ggcagcccac 17280 

ctatcaaggt gtactgcctt ccagacgaac gaagagcgat tgaggaaaag gcggcggcgg 17340 

ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca gggctacaaa atcacgggcg 17400 

tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa tggcgacctg ggccgcctgg 17460 

gcggcctgct gaaactctgg ctcaccgacg acccgcgcac ggcgcggttc ggtgatgcca 1752 0 

cgatcctcgc cctgctggcg aagatcgaag agaagcagga cgagcttggc aaggtcatga 17580 

tgggcgtggt ccgcccgagg gcagagccat gactttttta gccgctaaaa cgg^cggggg 17640 

gtgcgcgtga ttgccaagca cgtccccatg cgctccatca agaagagcga cttcgcggag 17700 

ctggtgaagt acatcaccga cgagcaaggc aagaccgagc gcctttgcga cgctca 17756 
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<223> n is a, c, g, or t 
<400> 48 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 
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ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 
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catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 
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agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 
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cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag. tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 57 60 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 
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accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 642 0 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaacbgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 
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gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7 800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 



WO 2004/063359 PCT/EP2004/000099 

268/357 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 
gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 
gtggttggct tgtatggagc agcagacgcg cfcacttcgag cggaggcatc cggagcttgc 9720 
aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 
cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 
ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 
gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 
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tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 
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tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 

tatgatccag ttagaacaac cactcagtca tcaagcaaaa ctgactccag tactgagaag 11460 

taaatctcag tttaaggggc ttttcattgc tattgtcatt gttagcgcat gggtcattag 11520 

cctgagttta ttactttccc ttgacatctc aaagctaaaa ttttggatgt tattgcctgt 11580 

tatactatgg caaacatttt tatatacggg attatttatt acatctcatg atgccatgca 11640 

tggcgtagta tttccccaaa acaccaagat taatcatttg attggaacat tgaccctatc 11700 

cctttatggt cttttaccat atcaaaaact attgaaaaaa cattggttac accaccacaa 11760 

tccagcaagc tcaatagacc cggattttca caatggtaaa caccaaagtt tctttgcttg 11820 

gtattttcat tttatgaaag gttactggag ttgggggcaa ataattgcgt tgactattat 11880 

ttataacttt gctaaataca tactccatat cccaagtgat aatctaactt acttttgggt 11940 

gctaccctcg cttttaagtt cattacaatt attctatttt ggtacttttt taccccatag 12000 

tgaaccaata gggggttatg ttcagcctca ttgtgcccaa acaattagcc gtcctatttg 12060 

gtggtcattt atcacgtgct atcattttgg ctaccacgag gaacatcacg aatatcctca 12120 

tatttcttgg tggcagttac cagaaattta caaagcaaaa tagaagcttg gcgtaatcat 12180 

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 122 40 

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 123 00 

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 12360 

tcggccaacg cgcggggaga ggcggtttgc gtattgggcc aaagacaaaa gggcgacatt 12420 

caaccgattg agggagggaa ggtaaatatt gacggaaatt attcattaaa ggtgaattat 12480 

caccgtcacc gacttgagcc atttgggaat tagagccagc aaaatcacca gtagcaccat 12540 
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taccattagc aaggccggaa acgtcaccaa tgaaaccatc gatagcagca ccgtaatcag 12600 
tagcgacaga atcaagtttg cctttagcgt cagactgtag cgcgttttca tcggcatttt 12660 
cggtcatagc ccccttatta gcgtttgcca tcttttcata atcaaaatca ccggaaccag 12720 
agccaccacc ggaaccgcct ccctcagagc cgccaccctc agaaccgcca ccctcagagc 12780 
caccaccctc agagccgcca ccagaaccac caccagagcc gccgccagca ttgacaggag 12840 
gcccgatcta gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat 12900 
attttgtttt ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat 12960 
ctcataaata acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga 13020 
aattatatga taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc 13080 
caaatgtttg aacgatcggg gatcatccgg gtctgtggcg ggaactccac gaaaatatcc 13140 
gaacgcagca agatatcgcg gtgcatctcg gtcttgcctg ggcagtcgcc gccgacgccg 13200 
ttgatgtgga cgccgggccc gatcatattg tcgctcagga tcgtggcgtt gtgcttgtcg 13260 
gccgttgctg tcgtaatgat atcggcacct tcgaccgcct gttccgcaga gatcccgtgg 13320 
gcgaagaact ccagcatgag atccccgcgc tggaggatca tccagccggc gtcccggaaa 13380 
acgattccga agcccaacct ttcatagaag gcggcggtgg aatcgaaatc tcgtgatggc 13440 
aggttgggcg tcgcttggtc ggtcatttcg aaccccagag tcccgctcag aagaactcgt 13500 
caagaaggcg atagaaggcg atgcgctgcg aatcgggagc ggcgataccg taaagcacga 13560 
ggaagcggtc agcccattcg ccgccaagct cttcagcaat atcacgggta gccaacgcta 13620 
tgtcctgata gcggtccgcc acacccagcc ggccacagtc gatgaatcca gaaaagcggc 13680 
cattttccac catgatattc ggcaagcagg catcgccatg ggtcacgacg agatcatcgc 13740 
cgtcgggcat gcgcgccttg agcctggcga acagttcggc tggcgcgagc ccctgatgct 13800 
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cttcgtccag atcatcctga tcgacaagac cggcttccat ccgagtacgt gctcgctcga 13860 
tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg atcaagcgta tgcagccgcc 13920 
gcattgcatc agccatgatg gatactttct cggcaggagc aaggtgagat gacaggagat 13980 
cctgccccgg cacttcgccc aatagcagcc agtcccttcc cgcttcagtg acaacgtcga 14040 
gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga tagccgcgct gcctcgtcct 14100 
gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa aagaaccggg cgcccctgcg 14160 
ctgacagccg gaacacggcg gcatcagagc agccgattgt ctgttgtgcc cagtcatagc 14220 
cgaatagcct ctccacccaa gcggccggag aacctgcgtg caatccatct tgttcaatca 14280 
tgcgaaacga tccagatccg gtgcagatta tttggattga gagtgaatat gagactctaa 14340 
ttggataccg aggggaattt atggaacgtc agtggagcat ttttgacaag aaatatttgc 14400 
tagctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc 14460 
ttagctcatt aaactccaga aacccgcggc tgagtggctc cttcaacgtt gcggttctgt 14520 
cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 14580 
ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt 14640 
tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat 14700 
atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 14760 
gggttcccca gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg 14820 
atccgacagc gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag 14880 
cagaatgcca tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg 14940 
cagcaccggc ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac 15000 
gatcaggggt atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg 15060 
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aacgcgcgga ttctttatca ctgataagtt ggtggacata ttatgtttat cagtgataaa 15120 

gtgtcaagca tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg 15180 

aacgaggtcg gcgtagacgg tctgacgaca cgcaaactgg cggaacggtt gggggttcag 15240 

cagccggcgc tttactggca cttcaggaac aagcgggcgc tgctcgacgc actggccgaa 15300 

gccatgctgg cggagaatca tacgcattcg gtgccgagag ccgacgacga ctggcgctca 15360 

tttctgatcg ggaatgcccg cagcttcagg caggcgctgc tcgcctaccg cgatggcgcg 15420 

cgcatccatg ccggcacgcg accgggcgca ccgcagatgg aaacggccga cgcgcagctt 15480 

cgcttcctct gcgaggcggg tttttcggcc ggggacgccg tcaatgcgct gatgacaatc 15540 

agctacttca ctgttggggc cgtgcttgag gagcaggccg gcgacagcga tgccggcgag 15600 

cgcggcggca ccgttgaaca ggctccgctc tcgccgctgt tgcgggccgc gatagacgcc 15660 

ttcgacgaag ccggtccgga cgcagcgttc gagcagggac tcgcggtgat tgtcgatgga 15720 

ttggcgaaaa ggaggctcgt tgtcaggaac gttgaaggac cgagaaaggg tgacgattga 15780 

tcaggaccgc tgccggagcg caacccactc actacagcag agccatgtag acaacatccc 15840 

ctcccccttt ccaccgcgtc agacgcccgt agcagcccgc tacgggcttt ttcatgccct 15900 

gccctagcgt ccaagcctca cggccgcgct cggcctctct ggcggccttc tggcgctctt 15960 

ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16020 

ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16080 

tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16140 

tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16200 

gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 16260 

ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16320 
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tggcgctttt ccgctgcata accctgcttc ggggtcatta tagcgatttt ttcggtatat 16380 

ccatcctttt tcgcacgata tacaggattt tgccaaaggg ttcgtgtaga ctttccttgg 16440 

tgtatccaac ggcgtcagcc gggcaggata ggtgaagtag gcccacccgc gagcgggtgt 16500 

tccttcttca ctgtccctta ttcgcacctg gcggtgctca acgggaatcc tgctctgcga 16560 

ggctggccgg ctaccgccgg cgtaacagat gagggcaagc ggatggctga tgaaaccaag 16620 

ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg 16680 

attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc 16740 

cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc 16800 

aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc 16860 

acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag 16920 

gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt 16980 

tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat 17040 

caagaagagc gacttcgcgg agctggtgaa gtacatcacc gacgagcaag gcaagaccga 17100 

gcgcctttgc gacgctca 17118 
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<223> n is a, c, g, or t 



<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 49 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 

aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 
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cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 12 60 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 13 80 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 

tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 
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accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaafcc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 
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cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caaagcttga gattaaaata gataaggaaa 4020 

agaaagtgaa aagaaattcg gaagcatggc acattcttct ttttataaat acatgcctga 4080 

ctttcttttt ccatcgatat gatatatgca tatgatagat atacaagcaa tcttcttcaa 4140 

ggagtttgaa attttgtcct ccaggagcaa aaaaaagttt ttttttatac atgtttgtac 4200 

acaagaatag ttaccaattt gctttggtct tacgtgctgc aagtttatat cgttttcaat 42 60 

ttctttgtct ttacattttc tttgtccttt atctttcctc atttagtctt tgggagaatt 4320 

aggaaaaggg agcggaaagg taagaaatgc ttgcgtattt tactaattcg gcaaacatcc 4380 

aatttggcaa acagcagcct gtgcaacgct ctcgagatga cagtatcttt gattacactc 4440 

taaatctcga tgacccgacc aaaaagagcg aacaaagaaa taatcttgtg cattcgaata 4500 

tgatggaaga ttttttcccc cttattctaa atgttgacat agcgtgtatg ttatataaac 4560 

aaaaagaaat tgtacaaact ttcttttctt ctctttttat tttatctcta tgctgtcgaa 4620 

gctgcagtca atcagcgtca aggcccgccg cgttgaacta gcccgcgaca tcacgcggcc 4680 
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caaagtctgc ctgcatgctc agcggtgctc gttagttcgg ctgcgagtgg cagcaccaca 4740 

gacagaggag gcgctgggaa ccgtgcaggc tgccggcgcg ggcgatgagc acagcgccga 4800 

tgtagcactc cagcagcttg accgggctat cgcagagcgt cgtgcccggc gcaaacggga 4860 

gcagctgtca taccaggctg ccgccattgc agcatcaatt ggcgtgtcag gcattgccat 4920 

cttcgccacc tacctgagat ttgccatgca catgaccgtg ggcggcgcag tgccatgggg 4980 

tgaagtggct ggcactctcc tcttggtggt tggtggcgcg ctcggcatgg agatgtatgc 5040 

ccgctatgca cacaaagcca tctggcatga gtcgcctctg ggctggctgc tgcacaagag 5100 

ccaccacaca cctcgcactg gaccctttga agccaacgac ttgtttgcaa tcatcaatgg 5160 

actgcccgcc atgctcctgt gtacctttgg cttctggctg cccaacgtcc tgggggcggc 5220 

ctgctttgga gcggggctgg gcatcacgct atacggcatg gcatatatgt ttgtacacga 5280 

tggcctggtg cacaggcgct ttcccaccgg gcccatcgct ggcctgccct acatgaagcg 5340 

cctgacagtg gcccaccagc tacaccacag cggcaagtac ggtggcgcgc cctggggtat 5400 

gttcttgggt ccacaggagc tgcagcacat tccaggtgcg gcggaggagg tggagcgact 5460 

ggtcctggaa ctggactggt ccaagcgggc gattgtgact gatagcgaga ctctgggtcg 5520 

atgttatctg cctcaacaat ggcttagaaa agaagaaaca gaacaaatac agcaaggcaa 5580 

cgcccgtagc ctaggtgatc aaagactgtt gggcttgtct ctgaagcttg taggaaaggc 5640 

agacgctatc atggtgagag ctaagaaggg cattgacaag ttgccggcaa actgtcaagg 5700 

cggtgtacga gctgcttgcc aagtatatgc tgcaattgga tctgtactca agcagcagaa 5760 

gacaacatat cctacaagag ctcatctaaa aggaagcgaa cgtgccaaga ttgctctgtt 5820 

gagtgtatac aacctctatc aatctgaaga caagcctgtg gctctccgtc aagctagaaa 5880 

gattaagagt ttttttgttg attagtgaat ttttgtttta tttatgtctg atagttcaat 5940 
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aaagagacaa cacatacaat ataaaatcat tgtctttaaa tgttaattta gtagagtgta 6000 

aagcctgcat tttttttgta cgcataaaca atgaattcac cccgcttctg gtttttaaat 6060 

aattatgtca aactagggaa aattcttttt tttctcttcg ttcttttttt .ggcttgttgt 6120 

ggagtcacag gcttgtcttc agattgatag aggttgtata cactcaacag agcaatcttg 6180 

gcacgttcgc ttccttttag atgagctctt gtaggatatg ttgtcttctg ctgcttgagt 6240 

acagatccaa ttgcagcata tacttggcaa gcagctcgta caccgccttg acagtttgcc 6300 

ggcaacttgt caatgccctt cttagctctc accatgatag cgtctgcctt tcctacaagc 63 60 

ttcagagaca agcccaacag tctttgatca cctaggctac gggcgttgcc ttgctgtatt 6420 

tgttctgttt cttcttttct aagccattgt tgaggcagat aacatcgacc caacatcctc 6480 

gagccatact acagcataaa aggatacgtt ttctttaaca gaaatttacc cttttgttat 6540 

cagcacatac aaaaaaaaag aaatttaaga tgagtaggac ttccattctc tcaaaaattt 6600 

tattcaatcc ataaatgaat tatttttgga caaaaaagaa agattatgcc tgattttctc 6660 

tatttttttt ttttttacaa ctccaccaat actttctagc ccagcttggc gtaatcatgg 672 0 

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 6780 

ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 6840 

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 6900 

ggccaacgcg cggggagagg cggtttgcgt attgggccaa agacaaaagg gcgacattca 6960 

accgattgag ggagggaagg taaatattga cggaaattat tcattaaagg tgaattatca 7 020 

ccgtcaccga cttgagccat ttgggaatta gagccagcaa aatcaccagt agcaccatta 7080 

ccattagcaa ggccggaaac gtcaccaatg aaaccatcga tagcagcacc gtaatcagta 7140 

gcgacagaat caagtttgcc tttagcgtca gactgtagcg cgttttcatc ggcattttcg 7200 
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gtcatagccc ccttattagc gtttgccatc ttttcataat caaaatcacc ggaaccagag 7260 

ccaccaccgg aaccgcctcc ctcagagccg ccaccctcag aaccgccacc ctcagagcca 7320 

ccaccctcag agccgccacc agaaccacca ccagagccgc cgccagcatt gacaggaggc 7380 

ccgatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg cgcgctatat 7440 

tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa aaacccatct 7500 

cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat tcaacagaaa 7560 

ttatatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac tttattgcca 7620 

aatgtttgaa cgatcgggga tcatccgggt ctgtggcggg aactccacga aaatatccga 7680 

acgcagcaag atatcgcggt gcatctcggt cttgcctggg cagtcgccgc cgacgccgtt 7740 

gatgtggacg ccgggcccga tcatattgtc gctcaggatc gtggcgttgt gcttgtcggc 7800 

cgttgctgtc gtaatgatat cggcaccttc gaccgcctgt tccgcagaga tcccgtgggc 7860 

gaagaactcc agcatgagat ccccgcgctg gaggatcatc cagccggcgt cccggaaaac 7920 

gattccgaag cccaaccttt catagaaggc ggcggtggaa tcgaaatctc gtgatggcag 7980 

gttgggcgtc gcttggtcgg tcatttcgaa ccccagagtc ccgctcagaa gaactcgtca 8040 

agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 8100 

aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 8160 

tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 8220 

ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcatcgccg 82 80 

tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 8340 

tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 8400 

cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 8460 
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attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 8520 

tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 8580 

acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 8640 

agt teat tea gggcaccgga caggteggtc ttgacaaaaa gaaccgggcg cccctgcgct 87 00 

gaeagcegga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 8760 

aatagectet ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 8820 

cgaaacgatc cagatceggt gcagattatt tggattgaga gtgaatatga gactctaatt 8880 

ggataccgag gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgeta 8940 

gctgatagtg accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt 9000 

agctcattaa actccagaaa cccgcggctg agtggctcct tcaacgttgc ggttctgtca 9060 

gttccaaacg taaaaegget tgtcccgcgt categgeggg ggtcataacg tgactccctt 9120 

aattctccgc tcatgatcag attgtcgttt cccgccttca gtttaaacta tcagtgtttg 9180 

acaggatata ttggcgggta aacctaagag aaaagagcgt ttattagaat aateggatat 9240 

ttaaaagggc gtgaaaaggt ttatccgttc gtccatttgt atgtgcatgc caaccacagg 9300 

gttccccaga tctggcgccg gecagegaga cgagcaagat tggccgccgc ccgaaacgat 93 60 

ccgacagcgc gcccagcaca ggtgcgcagg caaattgeae caacgcatac agcgccagca 9420 

gaatgecata gtgggcggtg aegtegtteg agtgaaccag ategegcagg aggcccggca 9480 

gcaccggcat aatcaggccg atgccgacag cgtcgagcgc gaeagtgetc agaattacga 9540 

tcaggggtat gttgggtttc acgtctggcc tccggaccag cctccgctgg tccgattgaa 9600 

cgegeggatt ctttatcact gataagttgg tggacatatt atgtttatca gtgataaagt 9660 

gtcaagcatg acaaagttgc agecgaatae agtgatccgt gccgccctgg acctgttgaa 9720 
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cgaggtcggc gtagacggtc tgacgacacg caaactggcg gaacggttgg gggttcagca 9780 
gccggcgctt tactggcact tcaggaacaa gcgggcgctg ctcgacgcac tggccgaagc 9840 
catgctggcg gagaatcata cgcattcggt gccgagagcc gacgacgact ggcgctcatt 9900 
tctgatcggg aatgcccgca gcttcaggca ggcgctgctc gcctaccgcg atggcgcgcg 9960 

catccatgcc ggcacgcgac cgggcgcacc gcagatggaa acggccgacg cgcagcttcg 10020 

cttcctctgc gaggcgggtt tttcggccgg ggacgccgtc aatgcgctga tgacaatcag 10080 

ctacttcact gttggggccg tgcttgagga gcaggccggc gacagcgatg ccggcgagcg 10140 

cggcggcacc gttgaacagg ctccgctctc gccgctgttg cgggccgcga tagacgcctt 10200 

cgacgaagcc ggtccggacg cagcgttcga gcagggactc gcggtgattg tcgatggatt 10260 

ggcgaaaagg aggctcgttg tcaggaacgt tgaaggaccg agaaagggtg acgattgatc 10320 

aggaccgctg ccggagcgca acccactcac tacagcagag ccatgtagac aacatcccct 10380 

ccccctttcc accgcgtcag acgcccgtag cagcccgcta cgggcttttt catgccctgc 10440 

cctagcgtcc aagcctcacg gccgcgctcg gcctctctgg cggccttctg gcgctcttcc 10500 

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 10560 

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 10620 

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 10680 

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 10740 

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 10800 

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 10860 

gcgcttttcc gctgcataac cctgcttcgg ggtcattata gcgatttttt cggtatatcc 10920 

atcctttttc gcacgatata caggattttg ccaaagggtt cgtgtagact ttccttggtg 10980 
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tatccaacgg cgtcagccgg gcaggatagg tgaagtaggc ccacccgcga gcgggtgttc 11040 

cttcttcact gtcccttatt cgcacctggc ggtgctcaac gggaatcctg ctctgcgagg 11100 

ctggccggct accgccggcg taacagatga gggcaagcgg atggctgatg aaaccaagcc 11160 

aaccaggaag ggcagcccac ctatcaaggt gtactgcctt ccagacgaac gaagagcgat 11220 

tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc tacctgctgg ccgtcggcca 11280 

gggctacaaa atcacgggcg tcgtggacta tgagcacgtc cgcgagctgg cccgcatcaa 11340 

tggcgacctg ggccgcctgg gcggcctgct gaaactctgg ctcaccgacg acccgcgcac 11400 

ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg aagatcgaag agaagcagga 11460 

cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg gcagagccat gactttttta 11520 

gccgctaaaa cggccggggg gtgcgcgfcga ttgccaagca cgtccccatg cgctccatca 11580 

agaagagcga cttcgcggag ctggtgaagt acatcaccga cgagcaaggc aagaccgagc 11640 

gcctttgcga cgctcaccgg gctggttgcc ctcgccgctg ggctggcggc cgtctatggc 11700 

cctgcaaacg cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccgccggcgt 11760 

tgtggatacc tcgcggaaaa cttggccctc actgacagat gaggggcgga cgttgacact 11820 

tgaggggccg actcacccgg cgcggcgttg acagatgagg ggcaggctcg atttcggccg 11880 

gcgacgtgga gctggccagc ctcgcaaatc ggcgaaaacg cctgatttta cgcgagtttc 11940 
ccacagatga tgtggacaag cctggggata agtgccctgc ggtattgaca cttgaggggc 12000 
gcgactactg acagatgagg ggcgcgatcc ttgacacttg aggggcagag tgctgacaga 12060 
tgaggggcgc acctattgac atttgagggg ctgtccacag gcagaaaatc cagcatttgc 12120 
aagggtttcc gcccgttttt cggccaccgc taacctgtct tttaacctgc ttttaaacca 12180 
atatttataa accttgtttt taaccagggc tgcgccctgt gcgcgtgacc gcgcacgccg 12240 
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aaggggggtg cccccccttc tcgaaccctc ccggcccgct aacgcgggcc tcccatcccc 12300 

ccaggggctg cgcccctcgg ccgcgaacgg cctcacccca aaaatggcag cgctggcagt 12360 

ccttgccatt gccgggatcg gggcagtaac gggatgggcg atcagcccga gcgcgacgcc 12420 

cggaagcatt gacgtgccgc aggtgctggc atcgacattc agcgaccagg tgccgggcag 12480 

tgagggcggc ggcctgggtg gcggcctgcc cttcacttcg gccgtcgggg cattcacgga 12540 

cttcatggcg gggccggcaa tttttacctt gggcattctt ggcatagtgg tcgcgggtgc 12600 

cgtgctcgtg ttcgggggtg cgataaaccc agcgaaccat ttgaggtgat aggtaagatt 12660 

ataccgaggt atgaaaacga gaattggacc tttacagaat tactctatga agcgccatat 12720 

ttaaaaagct accaagacga agaggatgaa gaggatgagg aggcagattg ccttgaatat 12780 

attgacaata ctgataagat aatatatctt ttatatagaa gatatcgccg tatgtaagga 12840 

tttcaggggg caaggcatag gcagcgcgct tatcaatata tctatagaat gggcaaagca 12900 

taaaaacttg catggactaa tgcttgaaac ccaggacaat aaccttatag cttgtaaatt 12960 

ctatcataat tgggtaatga ctccaactta ttgatagtgt tttatgttca gataatgccc 13020 

gatgactttg tcatgcagct ccaccgattt tgagaacgac agcgacttcc gtcccagccg 13080 

tgccaggtgc tgcctcagat tcaggttatg ccgctcaatt cgctgcgtat atcgcttgct 13140 

gattacgtgc agctttccct tcaggcggga ttcatacagc ggccagccat ccgtcatcca 13200 

tatcaccacg tcaaagggtg acagcaggct cataagacgc cccagcgtcg ccatagtgcg 13260 

ttcaccgaat acgtgcgcaa caaccgtctt ccggagactg tcatacgcgt aaaacagcca 13320 

gcgctggcgc gatttagccc cgacatagcc ccactgttcg .tccatttccg cgcagacgat 13380 

gacgtcactg cccggctgta tgcgcgaggt taccgactgc ggcctgagtt ttttaagtga 13440 

cgtaaaatcg tgttgaggcc aacgcccata atgcgggctg ttgcccggca tccaacgcca 13500 
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ttcatggcca tatcaatgat tttctggtgc gtaccgggtt gagaagcggt gtaagtgaac 13560 
tgcagttgcc atgttttacg gcagtgagag cagagatagc gctgatgtcc ggcggtgctt 13620 
ttgccgttac gcaccacccc gtcagtagct gaacaggagg gacagctgat agacacagaa 13680 
gccactggag cacctcaaaa acaccatcat acactaaatc agtaagttgg cagcatcacc 13740 
cataattgtg gtttcaaaat cggctccgtc -gatactatgt tatacgccaa ctttgaaaac 13800 
aactttgaaa aagctgtttt ctggtattta aggttttaga atgcaaggaa cagtgaattg 13860 
gagttcgtct tgttataatt agcttcttgg ggtatcttta aatactgtag aaaagaggaa 13920 
ggaaataata aatggctaaa atgagaatat caccggaatt gaaaaaactg atcgaaaaat 13980 
accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag ctggtgggag 14040 
aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc acctatgatg 14100 
tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt ccaaaggtcc 14160 
tgcactttga acggcatgat ggctggagca afcctgctcat gagtgaggcc gatggcgtcc 14220 
tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag ctgtatgcgg 14280 
agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg aatagcttag 14340 
acagccgctt agccgaattg gattacttac tgaataacga tctggccgat gtggattgcg 14400 
aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat tttttaaaga 14460 
cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac agcaacatct 14520 
ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc agggcggaca 14580 
agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg gaagaacagt 14640 
atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa ataaaatatt 14700 
atattttact ggatgaattg ttttagtacc tagatgtggc gcaacgatgc cggcgacaag 14760 
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caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 14820 
aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 14880 
gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 14940 
gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 15000 
ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 15060 
gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 15120 
atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 15180 
aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 15240 
gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 15300 
gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 15360 
caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 15420 
atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 15480 
gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 15540 
caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 15600 
ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 15660 
cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 15720 
atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 15780 
atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 15840 
cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 15900 
gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 15960 
tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 16020 
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aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 16080 

gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 16140 

gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 16200 

ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact 16260 

tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag 16320 

gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc 16380 

aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg 16440 

tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg 16500 

tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg 16560 

acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc 16620 

gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga 16680 

tgatcgtccg acagattcca acgggaatct ggtggatgcg catcttcatc ctcggcgcac 16740 

ttaatatttc gctattctgg agcttgttgt ttatttcggt ctaccgcctg ccgggcgggg 16800 

tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt gttcatctct gccgctctgc 16860 

taggtagccc gatacgattg atggcggtcc tgggggctat ttgcggaact gcgggcgtgg 16920 

cgctgttggt gttgacacca aacgcagcgc tagatcctgt cggcgtcgca gcgggcctgg 16980 

cgggggcggt ttccatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc 17040 

ctctgctcac ctttaccgcc tggcaactgg cggccggagg acttctgctc gttccagtag 17100 
ctttagtgtt tgatccgcca atcccgatgc ctacaggaac caatgttctc ggcctggcgt 17160 
ggctcggcct gatcggagcg ggtttaacct acttcctttg gttccggggg atctcgcgac 17220 
tcgaacctac agttgtttcc ttactgggct ttctcagccc cagatctggg gtcgatcagc 17280 
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cggggatgca tcaggccgac agtcggaact tcgggtcccc gacctgtacc attcggtgag 17340 

caatggatag gggagttgat atcgtcaacg ttcacttcta aagaaatagc gccactcagc 17400 

ttcctcagcg gctttatcca gcgatttcct attatgtcgg catagttctc aagatcgaca 17460 

gcctgtcacg gttaagcgag aaatgaataa gaaggctgat aattcggatc tctgcgaggg 17520 

agatgatatt tgatcacagg cagcaacgct ctgtcatcgt tacaatcaac atgctaccct 17580 

ccgcgagatc atccgtgttt caaacccggc agcttagttg ccgttcttcc gaatagcatc 17640 

ggtaacatga gcaaagtctg ccgccttaca acggctctcc cgctgacgcc gtcccggact 17700 

gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg 17760 

ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac 17820 

acattgcgga cgtttttaat gtactggggt ggtttttctt ttcaccagtg agacgggcaa 17 880 

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 17940 

ttgccccagc aggcgaaaat cctgtttgat ggtggttccg aaatcggcaa aatcccttat 18000 

aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 18060 

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 18120 

ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 18180 

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 18240 

gcgagaaagg aagggaagaa agcgaaagga gcgggcgcca ttcaggctgc gcaactgttg 18300 

ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 183 60 

tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 18420 

ggccagtgaa ttcgagctcg gtacccggg 18449 
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<210> 50 

<211> 18617 

<212> DNA 

<213> Artificial 

<220> 

<223> Plasmid 



<220> 

<221> misc_feature 

<222> (10264) . . (10264) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10472) . . (10472) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (10563) . . (10563) 

<223> n is a, c, g, or t 



<400> 50 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 



ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 
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tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 
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ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 



WO 2004/063359 PCT/EP2004/000099 

293/357 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780 

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 42 00 
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 
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ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gafcgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520 

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 
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ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640 

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760 

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820 

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880 

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940 

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000 

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300 

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 63 60 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 
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cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 73 80 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 

tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 792 0 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 
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tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 

atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 

gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 

ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 

cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 

tcagtccctg gtaggcagct ttgccccgtc tgtccgcccg gtgtgtcggc ggggttgaca 8700 

aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 

cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 

tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacc.tgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 
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accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 

ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcaccag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 
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taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 10920 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc tcatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 

tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 

tatgctgtcg aagctgcagt caatcagcgt caaggcccgc cgcgttgaac tagcccgcga 11460 

catcacgcgg cccaaagtct gcctgcatgc tcagcggtgc tcgttagttc ggctgcgagt 1152 0 

ggcagcacca cagacagagg aggcgctggg aaccgtgcag gctgccggcg cgggcgatga 11580 

gcacagcgcc gatgtagcac tccagcagc.t tgaccgggct atcgcagagc gtcgtgcccg 11640 

gcgcaaacgg gagcagctgt cataccaggc tgccgccatt gcagcatcaa ttggcgtgtc 11700 

aggcattgcc atcttcgcca cctacctgag atttgccatg cacatgaccg tgggcggcgc 11760 

agtgccatgg ggtgaagtgg ctggcactct cctcttggtg gttggtggcg cgctcggcat 11820 

ggagatgtat gcccgctatg cacacaaagc catctggcat gagtcgcctc tgggctggct 118 80 
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gctgcacaag agccaccaca cacctcgcac tggacccttt gaagccaacg acttgtttgc 11940 
aatcatcaat ggactgcccg ccatgctcct gtgtaccttt ggcttctggc tgcccaacgt 12000 
cctgggggcg gcctgctttg gagcggggct gggcatcacg ctatacggca tggcatatat 12060 
gtttgtacac gatggcctgg tgcacaggcg ctttcccacc gggcccatcg ctggcctgcc 12120 
ctacatgaag cgcctgacag tggcccacca gctacaccac agcggcaagt acggtggcgc 12180 
gccctggggt atgttcttgg gtccacagga gctgcagcac attccaggtg cggcggagga 12240 
ggtggagcga ctggtcctgg aactggactg gtccaagcgg tagaagcttg agattaaaat 12300 
agataaggaa aagaaagtga aaagaaattc ggaagcatgg cacattcttc tttttataaa 123 60 
tacatgcctg actttctttt tccatcgata tgatatatgc atatgataga tatacaagca 12420 
atcttcttca aggagtttga aattttgtcc tccaggagca aaaaaaagtt tttttttata 12480 
catgtttgta cacaagaata gttaccaatt tgctttggtc ttacgtgctg caagtttata 12540 
tcgttttcaa tttctttgtc tttacatttt ctttgtcctt tatctttcct catttagtct 12600 
ttgggagaat taggaaaagg gagcggaaag gtaagaaatg cttgcgtatt ttactaattc 12660 
ggcaaacatc caatttggca aacagcagcc tgtgcaacgc tctcgagatg acagtatctt 12720 
tgattacact ctaaatctcg atgacccgac caaaaagagc gaacaaagaa ataatcttgt 12780 
gcattcgaat atgatggaag attttttccc ccttattcta aatgttgaca tagcgtgtat 12840 
gttatataaa caaaaagaaa ttgtacaaac tttcttttct tctcttttta ttttatctct 12900 
atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 12960 
aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcatg ggtcattagc 13020 
ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 13080 
atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 13140 
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ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 13200 

ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 13260 

ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 13320 

tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 13380 

tataactttg ctaaatacat actccatatc ccaagtgata atctaactta cttttgggtg 13440 

ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 13500 

gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 13560 

tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 13620 

atttcttggt ggcagttacc agaaatttac aaagcaaaat agaagcttgg cgtaatcatg 13680 

gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 13740 

cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 13800 

gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 13860 

cggccaacgc gcggggagag gcggtttgcg tattgggcca aagacaaaag ggcgacattc 13920 

aaccgattga gggagggaag gtaaatattg acggaaatta ttcattaaag gtgaattatc 13980 

accgtcaccg acttgagcca tttgggaatt agagccagca aaatcaccag tagcaccatt 14040 

accattagca aggccggaaa cgtcaccaat gaaaccatcg atagcagcac cgtaatcagt 14100 

agcgacagaa tcaagtttgc ctttagcgtc agactgtagc gcgttttcat cggcattttc 14160 

ggtcatagcc cccttattag cgtttgccat cttttcataa tcaaaatcac cggaaccaga 14220 

gccaccaccg gaaccgcctc cctcagagcc gccaccctca gaaccgccac cctcagagcc 14280 

accaccctca gagccgccac cagaaccacc accagagccg ccgccagcat tgacaggagg 14340 

cccgatctag taacatagat gacaccgcgc gcgataattt atcctagttt gcgcgctata 14400 
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ttttgttttc tatcgcgtat taaatgtata attgcgggac tctaatcata aaaacccatc 14460 

tcataaataa cgtcatgcat tacatgttaa ttattacatg cttaacgtaa ttcaacagaa 14520 

attatatgat aatcatcgca agaccggcaa caggattcaa tcttaagaaa ctttattgcc 14580 

aaatgtttga acgatcgggg atcatccggg tctgtggcgg gaactccacg aaaatatccg 14640 

aacgcagcaa gatatcgcgg tgcatctcgg tcttgcctgg gcagtcgccg ccgacgccgt 14700 

tgatgtggac gccgggcccg atcatattgt cgctcaggat cgtggcgttg tgcttgtcgg 14760 

ccgttgctgt cgtaatgata tcggcacctt cgaccgcctg ttccgcagag atcccgtggg 14820 

cgaagaactc cagcatgaga tccccgcgct ggaggatcat ccagccggcg tcccggaaaa 14880 

cgattccgaa gcccaacctt tcatagaagg cggcggtgga atcgaaatct cgtgatggca 14940 

ggttgggcgt cgcttggtcg gtcatttcga accccagagt cccgctcaga agaactcgtc 15000 

aagaaggcga tagaaggcga tgcgctgcga atcgggagcg gcgataccgt aaagcacgag 15060 

gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag ccaacgctat 15120 

gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag aaaagcggcc 15180 

attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga gatcatcgcc 15240 

gtcgggcatg cgcgccttga gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc 15300 

ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat 15360 

gcgatgtttc gcttggtggt cgaatgggca ggtagccgga tcaagcgtat gcagccgccg 15420 

cattgcatca gccatgatgg atactttctc ggcaggagca aggtgagatg acaggagatc 15480 

ctgccccggc acttcgccca atagcagcca gtcccttccc gcttcagtga caacgtcgag 15540 

cacagctgcg caaggaacgc ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg 15600 

cagttcattc agggcaccgg acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc 15660 
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tgacagccgg aacacggcgg catcagagca gccgattgtc tgttgtgccc agtcatagcc 15720 

gaatagcctc tccacccaag cggccggaga acctgcgtgc aatccatctt gttcaatcat 15780 

gcgaaacgat ccagatccgg tgcagattat ttggattgag agtgaatatg agactctaat 15840 

tggataccga ggggaattta tggaacgtca gtggagcatt tttgacaaga aatatttgct 15900 

agctgatagt gaccttaggc gacttttgaa cgcgcaataa tggtttctga cgtatgtgct 15960 

tagctcatta aactccagaa acccgcggct gagtggctcc ttcaacgttg cggttctgtc 16020 

agttccaaac gtaaaacggc ttgtcccgcg tcatcggcgg gggtcataac gtgactccct 16080 

taattctccg ctcatgatca gattgtcgtt tcccgccttc agtttaaact atcagtgttt 16140 

gacaggatat attggcgggt aaacctaaga gaaaagagcg tttattagaa taatcggata 16200 

tttaaaaggg cgtgaaaagg tttatccgtt cgtccatttg tatgtgcatg ccaaccacag 16260 

ggttccccag atctggcgcc ggccagcgag acgagcaaga ttggccgccg cccgaaacga 16320 

tccgacagcg cgcccagcac aggtgcgcag gcaaattgca ccaacgcata cagcgccagc 16380 

agaatgccat agtgggcggt gacgtcgttc gagtgaacca gatcgcgcag gaggcccggc 16440 

agcaccggca taatcaggcc gatgccgaca gcgtcgagcg cgacagtgct cagaattacg 16500 

atcaggggta tgttgggttt cacgtctggc ctccggacca gcctccgctg gtccgattga 16560 

acgcgcggat tctttatcac tgataagttg gtggacatat tatgtttatc agtgataaag 16620 

tgtcaagcat gacaaagttg cagccgaata cagtgatccg tgccgccctg gacctgttga 16680 

acgaggtcgg cgtagacggt ctgacgacac gcaaactggc ggaacggttg ggggttcagc 16740 

agccggcgct ttactggcac ttcaggaaca agcgggcgct gctcgacgca ctggccgaag 16800 

ccatgctggc ggagaatcat acgcattcgg tgccgagagc cgacgacgac tggcgctcat 16860 

ttctgatcgg gaatgcccgc agcttcaggc aggcgctgct cgcctaccgc gatggcgcgc 16920 
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gcatccatgc cggcacgcga ccgggcgcac cgcagatgga aacggccgac gcgcagcttc 16980 
gcttcctctg cgaggcgggt ttttcggccg gggacgccgt caatgcgctg atgacaatca 17040 
gctacttcac tgttggggcc gtgcttgagg agcaggccgg cgacagcgat gccggcgagc 17100 
gcggcggcac cgttgaacag gctccgctct cgccgctgtt gcgggccgcg atagacgcct 17160 
tcgacgaagc cggtccggac gcagcgttcg agcagggact cgcggtgatt gtcgatggat 17220 
tggcgaaaag gaggctcgtt gtcaggaacg ttgaaggacc gagaaagggt gacgattgat 17280 
caggaccgct gccggagcgc aacccactca ctacagcaga gccatgtaga caacatcccc 17340 
tccccctttc caccgcgtca gacgcccgta gcagcccgct acgggctttt tcatgccctg 17400 
ccctagcgtc caagcctcac ggccgcgctc ggcctctctg gcggccttct ggcgctcttc 17460 
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 17520 
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 17580 
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 17640 
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 17700 
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 177 60 
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 17820 
ggcgcttttc cgctgcataa ccctgcttcg gggtcattat agcgattttt tcggtatatc 17880 
catccttttt cgcacgatat acaggattt.t gccaaagggt tcgtgtagac tttccttggt 17940 
gtatccaacg gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt 18000 
ccttcttcac tgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag 18060 
gctggccggc taccgccggc gtaacagatg agggcaagcg gatggctgat gaaaccaagc 18120 
caaccaggaa gggcagccca cctatcaagg tgtactgcct tccagacgaa cgaagagcga 18180 
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ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc ctacctgctg gccgtcggcc 18240 

agggctacaa aatcacgggc gtcgtggact atgagcacgt ccgcgagctg gcccgcatca 18300 

atggcgacct gggccgcctg ggcggcctgc tgaaactctg gctcaccgac gacccgcgca 18360 

cggcgcggtt cggtgatgcc acgatcctcg ccctgctggc gaagatcgaa gagaagcagg 18420 

acgagcttgg caaggtcatg atgggcgtgg tccgcccgag ggcagagcca tgactttttt 18480 

agccgctaaa acggccgggg ggtgcgcgtg attgccaagc acgtccccat gcgctccatc 18540 

aagaagagcg acttcgcgga gctggtgaag tacatcaccg acgagcaagg caagaccgag 18600 

cgcctttgcg acgctca 18617 
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<400> 51 

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60 

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120 

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180 

ccggcgcggc gttgacagat gagggigcagg ctcgatttcg gccggcgacg tggagctggc 240 

cagcctcgca aatcggcgaa' aacgcctgat tttacgcgag tttcccacag atgatgtgga 300 

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360 

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420 

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480 

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540 

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600 

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660 

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720 

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780 

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840 

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900 

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960 

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020 

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080 

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140 

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200 

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260 
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ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320 

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380 

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440 

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500 

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560 

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620 

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680 

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740 

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800 

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860 

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920 

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980 

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040 

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100 

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160 

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220 

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280 

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340 

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400 

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460 

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520 
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tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580 

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640 

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700 

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 27 60 

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820 

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880 

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940 

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000 

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060 

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120 

tcttccgcat caagtgtttt ggctctcagg ccgaggcc.ca cggcaagtat ttgggcaagg 3180 

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240 

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300 

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360 

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420 

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480 

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540 

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600 

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3 660 

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720 

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 37 80 
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tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840 

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900 

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960 

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020 

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080 

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140 

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200 

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260 

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320 

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 43 80 

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440 

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500 

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560 

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620 

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680 

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740 

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800 

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860 

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920 

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980 

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040 
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tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100 

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160 

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220 

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280 

accaaacgca gcgct agate ctgtcggcgt cgcagcgggc ctggcggggg eggtttccat 5340 

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400 

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460 

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gectgategg 5520 

agegggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580 

ttccttactg ggctttctca gccccagatc tggggtcgat cagcegggga tgeatcagge 5640 

egacagtegg aacttegggt ccccgacctg taccattegg tgagcaatgg ataggggagt 5700 

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc ageggcttta 5760 

tecagegatt tcctattatg teggcatagt tctcaagatc gaeagectgt cacggttaag 582 0 

cgagaaatga ataagaaggc tgataattcg gatctctgeg agggagatga tatttgatca 588 0 

caggcagcaa cgctctgtca tcgttacaat caacatgeta ccctccgcga gatcatccgt 5940 

gtttcaaacc eggcagctta gttgccgttc ttccgaatag categgtaac atgagcaaag 6000 

tctgccgcct tacaaegget ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060 

cgagtggtga ttttgtgccg agetgeeggt eggggagctg ttggctggct ggtggcagga 6120 

tatattgtgg tgtaaacaaa ttgaegctta gacaacttaa taacacattg cggacgtttt 6180 

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240 

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggega 6300 
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aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360 

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420 

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 6480 

cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 6540 

ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 6600 

agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660 

cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 6720 

tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag 6780 

ctcggtaccc ggggatcttt cgacactgaa atacgtcgag cctgctccgc ttggaagcgg 6840 

cgaggagcct cgtcctgtca caactaccaa catggagtac gataagggcc agttccgcca 6900 

gctcattaag agccagttca tgggcgttgg catgatggcc gtcatgcatc tgtacttcaa 6960 

gtacaccaac gctcttctga tccagtcgat catccgctga aggcgctttc gaatctggtt 7020 

aagatccacg tcttcgggaa gccagcgact ggtgacctcc agcgtccctt taaggctgcc 7080 

aacagctttc' tcagccaggg ccagcccaag accgacaagg cctccctcca gaacgccgag 7140 

aagaactgga ggggtggtgt caaggaggag taagctcctt attgaagtcg gaggacggag 7200 

cggtgtcaag aggatattct tcgactctgt attatagata agatgatgag gaattggagg 7260 

tagcatagct tcatttggat ttgctttcca ggctgagact ctagcttgga gcatagaggg 7320 

tcctttggct ttcaatattc tcaagtatct cgagtttgaa cttattccct gtgaaccttt 7380 

tattcaccaa tgagcattgg aatgaacatg aatctgagga ctgcaatcgc catgaggttt 7440. 

tcgaaataca tccggatgtc gaaggcttgg ggcacctgcg ttggttgaat ttagaacgtg 7500 

gcactattga tcatccgata gctctgcaaa gggcgttgca caatgcaagt caaacgttgc 7560 
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tagcagttcc aggtggaatg ttatgatgag cattgtatta aatcaggaga tatagcatga 7620 

tctctagtta gctcaccaca aaagtcagac ggcgtaacca aaagtcacac aacacaagct 7680 

gtaaggattt cggcacggct acggaagacg gagaagccac cttcagtgga ctcgagtacc 7740 

atttaattct atttgtgttt gatcgagacc taatacagcc cctacaacga ccatcaaagt 7800 

cgtatagcta ccagtgagga agtggactca aatcgacttc agcaacatct cctggataaa 7860 

ctttaagcct aaactataca gaataagata ggtggagagc ttataccgag ctcccaaatc 7920 

tgtccagatc atggttgacc ggtgcctgga tcttcctata gaatcatcct tattcgttga 7980 

cctagctgat tctggagtga cccagagggt catgacttga gcctaaaatc cgccgcctcc 8040 

accatttgta gaaaaatgtg acgaactcgt gagctctgta cagtgaccgg tgactctttc 8100 

tggcatgcgg agagacggac ggacgcagag agaagggctg agtaataagc cactggccag 8160 

acagctctgg cggctctgag gtgcagtgga tgattattaa tccgggaccg gccgcccctc 8220 

cgccccgaag tggaaaggct ggtgtgcccc tcgttgacca agaatctatt gcatcatcgg 8280 

agaatatgga gcttcatcga atcaccggca gtaagcgaag gagaatgtga agccaggggt 8340 

gtatagccgt cggcgaaata gcatgccatt aacctaggta cagaagtcca attgcttccg 8400 
atctggtaaa agattcacga gatagtacct tctccgaagt aggtagagcg agtacccggc 8460 
gcgtaagctc cctaattggc ccatccggca tctgtagggc gtccaaatat cgtgcctctc 8520 
ctgctttgcc cggtgtatga aaccggaaag gccgctcagg agctggccag cggcgcagac 8580 
cgggaacaca agctggcagt cgacccatcc ggtgctctgc actcgacctg ctgaggtccc 8640 
tcagtccctg gtaggcagct ttgccccgtc tgtcogcccg gtgtgtcggc ggggttgaca 8700 
aggtcgttgc gtcagtccaa catttgttgc catattttcc tgctctcccc accagctgct 8760 
cttttctttt ctctttcttt tcccatcttc agtatattca tcttcccatc caagaacctt 8820 
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tatttcccct aagtaagtac tttgctacat ccatactcca tccttcccat cccttattcc 8880 

tttgaacctt tcagttcgag ctttcccact tcatcgcagc ttgactaaca gctaccccgc 8940 

ttgagcagac atcaccatgc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga 9000 

aaagttcgac agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt 9060 

cagcttcgat gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt 9120 

ctacaaagat cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt 9180 

gcttgacatt ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg 9240 

tgtcacgttg caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga 9300 

ggccatggat gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg 9360 

accgcaagga atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc 9420 

ccatgtgtat cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc 9480 

tctcgatgag ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc 9540 

ggatttcggc tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg 9600 

gagcgaggcg atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc 9660 

gtggttggct tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc 9720 

aggatcgccg cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag 9780 

cttggttgac ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt 9840 

ccgatccgga gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg 9900 

gaccgatggc tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc 9960 

gagggcaaag gaatagagta gatgccgacc gcgggatcga tccacttaac gttactgaaa 10020 

tcatcaaaca gcttgacgaa tctggatata agatcgttgg tgtcgatgtc agctccggag 10080 
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ttgagacaaa tggtgttcag gatctcgata agatacgttc atttgtccaa gcagcaaaga 10140 

gtgccttcta gtgatttaat agctccatgt caacaagaat aaaacgcgtt ttcgggttta 10200 

cctcttccag atacagctca tctgcaatgc attaatgcat tgactgcaac ctagtaacgc 10260 

cttncaggct ccggcgaaga gaagaatagc ttagcagagc tattttcatt ttcgggagac 10320 

gagatcaagc agatcaacgg tcgtcaagag acctacgaga ctgaggaatc cgctcttggc 10380 

tccacgcgac tatatatttg tctctaattg tactttgaca tgctcctctt ctttactctg 10440 

atagcttgac tatgaaaatt ccgtcacdag cncctgggtt cgcaaagata attgcatgtt 10500 

tcttccttga actctcaagc ctacaggaca cacattcatc gtaggtataa acctcgaaat 10560 

canttcctac taagatggta tacaatagta accatgcatg gttgcctagt gaatgctccg 10620 

taacacccaa tacgccggcc gaaacttttt tacaactctc ctatgagtcg tttacccaga 10680 

atgcacaggt acacttgttt agaggtaatc cttctttcta gctagaagtc ctcgtgtact 10740 

gtgtaagcgc ccactccaca tctccactcg acctgcaggc atgcaagctt gagattaaaa 10800 

tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt ctttttataa 10860 

atacatgcct gactttcttt ttccatcgat atgatatatg catatgatag atatacaagc 1092 0 

aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt ttttttttat 10980 

acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct gcaagtttat 11040 

atcgttttca atttctttgt ctttacatt-t tctttgtcct ttatctttcc toatttagtc 11100 

tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat tttactaatt 11160 

cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat gacagtatct 11220 

ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga aataatcttg 11280 

tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac atagcgtgta 11340 
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tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt attttatctc 11400 

tatgttgtgg atttggaatg ccctgatcgt tttcgttacc gtgattggca tggaagtgat 11460 

tgctgcactg gcacacaaat acatcatgca cggctggggt tggggatggc atctttcaca 1152 0 

tcatgaaccg cgtaaaggtg cgtttgaagt taacgatctt tatgccgtgg tttttgctgc 11580 

attatcgatc ctgctgattt atctgggcag tacaggaatg tggccgctcc agtggattgg 11640 

cgcaggtatg acggcgtatg gattactcta ttttatggtg cacgacgggc tggtgcatca 11700 

acgttggcca ttccgctata ttccacgcaa gggctacctc aaacggttgt atatggcgca 11760 

ccgtatgcat cacgccgtca ggggcaaaga aggttgtgtt tcttttggct tcctctatgc 11820 

gccgcccctg tcaaaacttc aggcgacgct ccgggaaaga catggcgcta gagcgggcgc 11880 

tgccagagat gcgcagggcg gggaggatga gcccgcatcc gggaagtaag ggcctgacca 11940 

gaggcggcca gcagcagcgt taatttttcg ggcgtggtcg ttgactgccg ctgatcccaa 12000 

agcttgagat taaaatagat aaggaaaaga aagtgaaaag aaattcggaa gcatggcaca 12060 

ttcttctttt tataaataca tgcctgactt tctttttcca tcgatatgat atatgcatat 12120 

gatagatata caagcaatct tcttcaagga gtttgaaatt ttgtcctcca ggagcaaaaa 12180 

aaagtttttt tttatacatg tttgtacaca agaatagtta ccaatttgct ttggtcttac 12240 

gtgctgcaag tttatatcgt tttcaatttc tttgtcttta cattttcttt gtcctttatc 12300 

tttcctcatt tagtctttgg gagaattagg aaaagggagc ggaaaggtaa gaaatgcttg 123 60 

cgtattttac taattcggca aacatccaat ttggcaaaca gcagcctgtg caacgctctc 12420 

gagatgacag tatctttgat tacactctaa atctcgatga cccgaccaaa aagagcgaac 12480 

aaagaaataa tcttgtgcat tcgaatatga tggaagattt tttccccctt attctaaatg 12540 

ttgacatagc gtgtatgtta tataaacaaa aagaaattgt acaaactttc ttttcttctc 12600 
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tttttatttt atctctatga tccagttaga acaaccactc agtcatcaag caaaactgac 12660 

tccagtactg agaagtaaat ctcagtttaa ggggcttttc attgctattg tcattgttag 12720 

cgcatgggtc attagcctga gtttattact ttcccttgac atctcaaagc taaaattttg 12780 

gatgttattg cctgttatac tatggcaaac atttttatat acgggattat ttattacatc 12840 

tcatgatgcc atgcatggcg tagtatttcc ccaaaacacc aagattaatc atttgattgg 12900 

aacattgacc ctatcccttt atggtctttt accatatcaa aaactattga aaaaacattg 12960 

gttacaccac cacaatccag caagctcaat agacccggat tttcacaatg gtaaacacca 13020 

aagtttcttt gcttggtatt ttcattttat gaaaggttac tggagttggg ggcaaataat 13080 

tgcgttgact attatttata actttgctaa atacatactc catatcccaa gtgataatct 13140 

aacttacttt tgggtgctac cctcgctttt aagttcatta caattattct attttggtac 13200 

ttttttaccc catagtgaac caataggggg ttatgttcag cctcattgtg cccaaacaat 13260 

tagccgtcct atttggtggt catttatcac gtgctatcat tttggctacc acgaggaaca 13320 

tcacgaatat cctcatattt cttggtggca gttaccagaa atttacaaag caaaatagaa 13380 

gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 13440 

cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 13500 

aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 13560 

agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggccaaaga 13620 

caaaagggcg acattcaacc gattgaggga gggaaggtaa atattgacgg aaattattca 13680 

ttaaaggtga attatcaccg tcaccgactt gagccatttg ggaattagag ccagcaaaat 13740 

caccagtagc accattacca ttagcaaggc cggaaacgtc accaatgaaa ccatcgatag 13800 

cagcaccgta atcagtagcg acagaatcaa gtttgccttt agcgtcagac tgtagcgcgt 13860 
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tttcatcggc attttcggtc atagccccct tattagcgtt tgccatcttt tcataatcaa 13920 

aatcaccgga accagagcca ccaccggaac cgcctccctc agagccgcca ccctcagaac 13980 

cgccaccctc agagccacca ccctcagagc cgccaccaga accaccacca gagccgccgc 14040 

cagcattgac aggaggcccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 14100 

tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 14160 

atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 14220 

acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 14280 

aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 14340 

tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 14400 

tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 14460 

gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 14520 

gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 145 80 

ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 14640 

aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 14700 

ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 14760 

taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 14820 

gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 14880 

atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 14940 

cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 15000 

cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 15060 

tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 15120 
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gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 15180 

gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 15240 

cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 15300 

gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 153 60 

ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 15420 

gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 15480 

catcttgttc aatcatgcga aacgatccag atccggtgca gattatttgg attgagagtg 15540 

aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg agcatttttg 15600 

acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg caataatggt 15660 

ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt ggctccttca 15720 

acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat cggcgggggt 15780 

cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc gccttcagtt 15840 

taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta 15900 

ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg 15960 

tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga gcaagattgg 16020 

ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa attgcaccaa 16080 

cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt gaaccagatc 16140 

gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt cgagcgcgac 16200 

agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc ggaccagcct 162 60 

ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg acatattatg 16320 

tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt gatccgtgcc 163 80 
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gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa actggcggaa 16440 

cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg ggcgctgctc 16500 

gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc gagagccgac 16560 

gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc gctgctcgcc 16620 

taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca gatggaaacg 16680 

gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga cgccgtcaat 16740 

gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca ggccggcgac 16800 

agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc gctgttgcgg 16860 

gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca gggactcgcg 16920 

gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga aggaccgaga 16980 

aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac agcagagcca 17040 

tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag cccgctacgg 17100 

gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc tctctggcgg 17160 

ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 17220 

ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 17280 

acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 17340 

cgttgctggc gtttttccat aggctccgcc .cccctgacga gcatcacaaa aatcgacgct 17400 

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 17460 

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 17520 

tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt cattatagcg 17580 

attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca aagggttcgt 17640 
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gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga agtaggccca 17700 

cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt gctcaacggg 17760 

aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg caagcggatg 17820 

gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta ctgccttcca 17880 

gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct gtcggcctac 17940 

ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga gcacgtccgc 18000 

gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa actctggctc 18060 

accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct gctggcgaag 18120 

atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg cccgagggca 18180 

gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg ccaagcacgt 18240 

ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca tcaccgacga 18300 

gcaaggcaag accgagcgcc tttgcgacgc tea 18333 

<210> 52 

<211> 17 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

<221> misc_feature 

<222> (3).. (3) 

<223> n is a, c, g, or t 

<220> 

<221> misc_f eature 
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<222> (9).. (9) 

<223> n is a, c, g, or t 

<400> 52 

gcngarggna thtggta . 17 



<210> 53 

<211> 20 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<220> 

<2 2 1> misc_f eature 

<222> (3).. (3) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> <6)..(6) 

<223> n is a, c, g, or t 

<400> 53 

tcngcnagra adatrttrtg 



<210> 54 

<211> 27 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 54 

aagtgacacc ggttacacgc ttgtctt 



27 
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<210> 55 
<211> 27 
<212>. DNA 
<213> Artificial 



<220> 

<223> Primer 
<400> 55 

gcttatcacc atctgttacc tccttgc 



<210> 56 

<211> 32 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 
<400> 56 

agagagggat ccttaaatgc gaatatcgtt gc 



<210> 57 

<211> 32 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 57 

agagagggat ccatgtctga tcaaaagaag ca 



<210> 58 

<211> 37 

<212> DNA 

<213> Artificial 



<220> 
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<223> Primer 
<400> 58 

actttattgg atccttaaat gcgaatatcg ttgctgc 37 



<210> 59 

<211> 38 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 59 

gttccaattg gccacatgaa gagtaagaca ggaaacag 



<210> 60 

<211> 38 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 60 

cctgtcttac tcttcatgtg gccaattgga accaacac 38 



<210> 61 

<211> 38 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 



<400> 61 

ctattttaat catatgtctg atcaaaagaa gcatattg 



38 
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<210> 62 
<211> 16103 
<212> DNA 
<213> Artificial 

<220> 

<223> Primer 



<220> 

<221> misc_feature 

<222> (3471) . . (3471) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (3679) . . (3679) 

<223> n is a, c, g, or t 

<220> 

<221> misc_ feature 

<222> (3770) . . (3770) 

<223> n is a, c, g, or t 

<400> 62 

gatctttcga cactgaaata cgtcgagcct gctccgcttg gaagcggcga ggagcctcgt 60 

cctgtcacaa ctaccaacat ggagtacgat aagggccagt tccgccagct cattaagagc 120 

cagttcatgg gcgttggcat gatggccgtc atgcatctgt acttcaagta caccaacgct 180 

cttctgatcc agtcgatcat ccgctgaagg cgctttcgaa tctggttaag atccacgtct 240 

tcgggaagcc agcgactggt gacctccagc gtccctttaa ggctgccaac agctttctca 300 

gccagggcca gcccaagacc gacaaggcct ccctccagaa cgccgagaag aactggaggg 360 

gtggtgtcaa ggaggagtaa gctccttatt gaagtcggag gacggagcgg tgtcaagagg 420 

atattcttcg actctgtatt atagataaga tgatgaggaa ttggaggtag catagcttca 480 

tttggatttg ctttccaggc tgagactcta gcttggagca tagagggtcc tttggctttc 540 
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aatattctca agtatctcga gtttgaactt attccctgtg aaccttttat tcaccaatga 600 

gcattggaat gaacatgaat ctgaggactg caatcgccat gaggttttcg aaatacatcc 660 

ggatgtcgaa ggcttggggc acctgcgttg gttgaattta gaacgtggca ctattgatca 720 

tccgatagct ctgcaaaggg cgttgcacaa tgcaagtcaa acgttgctag cagttccagg 780 

tggaatgtta tgatgagcat tgtattaaat caggagatat agcatgatct ctagttagct 840 

caccacaaaa gtcagacggc gtaaccaaaa gtcacacaac acaagctgta aggatttcgg 900 

cacggctacg gaagacggag aagccacctt cagtggactc gagtaccatt taattctatt 960 

tgtgtttgat cgagacctaa tacagcccct acaacgacca tcaaagtcgt atagctacca 1020 

gtgaggaagt ggactcaaat cgacttcagc aacatctcct ggataaactt taagcctaaa 1080 

ctatacagaa taagataggt ggagagctta taccgagctc ccaaatctgt ccagatcatg 1140 

gttgaccggt gcctggatct tcctatagaa tcatccttat tcgttgacct agctgattct 1200 

ggagtgaccc agagggtcat gacttgagcc taaaatccgc cgcctccacc atttgtagaa 1260 

aaatgtgacg aactcgtgag ctctgtacag tgaccggtga ctctttctgg catgcggaga 1320 

gacggacgga cgcagagaga agggctgagt aataagccac tggccagaca gctctggcgg 1380 

ctctgaggtg cagtggatga ttattaatcc gggaccggcc gcccctccgc cccgaagtgg 1440 

aaaggctggt gtgcccctcg ttgaccaaga atctattgca tcatcggaga atatggagct 1500 

tcatcgaatc accggcagta agcgaaggag aatgtgaagc caggggtgta tagccgtcgg 1560 

cgaaatagca tgccattaac ctaggtacag aagtccaatt gcttccgatc tggtaaaaga 1620 

ttcacgagat agtaccttct ccgaagtagg tagagcgagt acccggcgcg taagctccct 1680 

aattggccca tccggcatct gtagggcgtc caaatatcgt gcctctcctg ctttgcccgg 1740 

tgtatgaaac cggaaaggcc gctcaggagc tggccagcgg cgcagaccgg gaacacaagc 1800 
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tggcagtcga cccatccggt gctctgcact cgacctgctg aggtccctca gtccctggta 1860 

ggcagctttg ccccgtctgt ccgcccggtg tgtcggcggg gttgacaagg tcgttgcgtc 1920 

agtccaacat ttgttgccat attttcctgc tctccccacc agctgctctt ttcttttctc 1980 

tttcttttcc catcttcagt atattcatct tcccatccaa gaacctttat ttcccctaag 2040 

taagtacttt gctacatcca tactccatcc ttcccatccc ttattccttt gaacctttca 2100 

gttcgagctt tcccacttca tcgcagcttg actaacagct accccgcttg agcagacatc 2160 

accatgcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 2220 

gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 2280 

ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 2340 

tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 2400 

gaattcagcg agagcctgac ctattgcatc tcccgccgtg cacagggtgt cacgttgcaa 2460 

gacctgcctg aaaccgaact gcccgctgtt ctgcagccgg tcgcggaggc catggatgcg 2520 

atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 2580 

ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 2 640 

tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 2700 

atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 2760 

aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 2820 

ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 2880 

atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccgcgg 2940 

ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 3000 

aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 3060 



WO 2004/063359 PCT/EP2004/000099 

327/357 

gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 3120 

gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaaggaa 3180 

tagagtagat gccgaccgcg ggatcgatcc acttaacgtt actgaaatca tcaaacagct 3240 

tgacgaatct ggatataaga tcgttggtgt cgatgtcagc tccggagttg agacaaatgg 3300 

tgttcaggat ctcgataaga tacgttcatt tgtccaagca gcaaagagtg ccttctagtg 3360 

atttaatagc tccatgtcaa caagaataaa acgcgttttc gggtttacct cttccagata 3420 

cagctcatct gcaatgcatt aatgcattga ctgcaaccta gtaacgcctt ncaggctccg 3480 

gcgaagagaa gaatagctta gcagagctat tttcattttc gggagacgag atcaagcaga 3540 

tcaacggtcg tcaagagacc tacgagactg aggaatccgc tcttggctcc acgcgactat 3600 

atatttgtct ctaattgtac tttgacatgc tcctcttctt tactctgata gcttgactat 3 660 

gaaaattccg tcaccagcnc ctgggttcgc aaagataatt gcatgtttct tccttgaact 3720 

ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcan ttcctactaa 3780 • 

gatggtatac aatagtaacc atgcatggtt gcctagtgaa tgctccgtaa cacccaatac 3840 

gccggccgaa acttttttac aactctccta tgagtcgttt acccagaatg cacaggtaca 3900 

cttgtttaga ggtaatcctt ctttctagct agaagtcctc gtgtactgtg taagcgccca 3960 

ctccacatct ccactcgacc tgcaggcatg caagcttgag tctatcgcct ccaaaaagta 4020 

cggtgctgaa ttcagatatc aatcgcctgt tgctaaaatt aacactgtcg ataaagacaa 4080 

gcgtgtaacc ggtgtcactt tggaaagcgg agaagtcatt gaagccgatg cagtcgtatg 4140 

taatgcggat cttgtttatg cttatcacca tctgttacct ccttgcaatt ggacaaagaa 4200 

gacattagcc tcaaagaaac tcacttcatc atctatttcg ttttattggt ccatgtcaac 4260 

aaaggtgcct caattagacg tacacaatat cttcttggct gaagcctaca aggaaagttt 4320 
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tgatgagatt ttcaacgact tcggtttgcc ctctgaagct tggcgtaatc atggtcatag 4380 

ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 4440 

ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 4500 

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4560 

cgcgcgggga gaggcggttt gcgtattggg ccaaagacaa aagggcgaca ttcaaccgat 4620 

tgagggaggg aaggtaaata ttgacggaaa ttattcatta aaggtgaatt atcaccgtca 4680 

ccgacttgag ccatttggga attagagcca gcaaaatcac cagtagcacc attaccatta 4740 

gcaaggccgg aaacgtcacc aatgaaacca tcgatagcag caccgtaatc agtagcgaca 4800 

gaatcaagtt tgcctttagc gtcagactgt agcgcgtttt catcggcatt ttcggtcata 4860 

gcccccttat tagcgtttgc catcttttca taatcaaaat caccggaacc agagccacca 4920 

ccggaaccgc ctccctcaga gccgccaccc tcagaaccgc caccctcaga gccaccaccc 4980 

tcagagccgc caccagaacc accaccagag ccgccgccag cattgacagg aggcccgatc 5040 

tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt 5100 

ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa 5160 

taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat 5220 

gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt 5280 

tgaacgatcg gggatcatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag 5340 

caagatatcg cggtgcatct cggtcttgcc tgggcagtcg ccgccgacgc cgttgatgtg 5400 

gacgccgggc ccgatcatat tgtcgctcag gatcgtggcg ttgtgcttgt cggccgttgc 5460 

tgtcgtaatg atatcggcac cttcgaccgc ctgttccgca gagatcccgt gggcgaagaa 5520 

ctccagcatg agatccccgc gctggaggat catccagccg gcgtcccgga aaacgattcc 5580 
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gaagcccaac ctttcataga aggcggcggt ggaatcgaaa tctcgtgatg gcaggttggg 5640 

cgtcgcttgg tcggtcattt cgaaccccag agtcccgctc agaagaactc gtcaagaagg 5700 

cgatagaagg cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg 5760 

tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccaacgc tatgtcctga 5820 

tagcggtccg ccacacccag ccggccacag tcgatgaatc cagaaaagcg gccattttcc 5880 

accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcatc gccgtcgggc 5940 

atgcgcgcct tgagcctggc gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc 6000 

agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt 6060 

ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca 6120 

tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc 6180 

ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 6240 

gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca 6300 

ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 6360 

cggaacacgg cggcatcaga gcagccgatt gtctgttgtg cccagtcata gccgaatagc 6420 

ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat catgcgaaac 6480 

gatccagatc cggtgcagat tatttggatt gagagtgaat atgagactct aattggatac 6540 

cgaggggaat ttatggaacg tcagtggagc atttttgaca agaaatattt gctagctgat 6600 

agtgacctta ggcgactttt gaacgcgcaa taatggtttc tgacgtatgt gcttagctca 6660 

ttaaactcca gaaacccgcg gctgagtggc tccttcaacg ttgcggttct gtcagttcca 6720 

aacgtaaaac ggcttgtccc gcgtcatcgg cgggggtcat aacgtgactc ccttaattct 6780 

ccgctcatga tcagattgtc gtttcccgcc ttcagtttaa actatcagtg tttgacagga 6840 
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tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa 6900 

gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 6960 

cagatctggc gccggccagc gagacgagca agattggccg ccgcccgaaa cgatccgaca 7020 

gcgcgcccag cacaggtgcg caggcaaatt gcaccaacgc atacagcgcc agcagaatgc 7080 

catagtgggc ggtgacgtcg ttcgagtgaa ccagatcgcg caggaggccc ggcagcaccg 7140 

gcataatcag gccgatgccg acagcgtcga gcgcgacagt gctcagaatt acgatcaggg 7200 

gtatgttggg tttcacgtct ggcctccgga ccagcctccg ctggtccgat tgaacgcgcg 7260 

gattctttat cactgataag ttggtggaca tattatgttt atcagtgata aagtgtcaag 7320 

catgacaaag ttgcagccga atacagtgat ccgtgccgcc ctggacctgt tgaacgaggt 7380 

cggcgtagac ggtctgacga cacgcaaact ggcggaacgg ttgggggttc agcagccggc 7440 

gctttactgg cacttcagga acaagcgggc gctgctcgac gcactggccg aagccatgct 7500 

ggcggagaat catacgcatt cggtgccgag agccgacgac gactggcgct catttctgat 7560 

cgggaatgcc cgcagcttca ggcaggcgct gctcgcctac cgcgatggcg cgcgcatcca 7620 

tgccggcacg cgaccgggcg caccgcagat ggaaacggcc gacgcgcagc ttcgcttcct 7680 

ctgcgaggcg ggtttttcgg ccggggacgc cgtcaatgcg ctgatgacaa tcagctactt 7740 

cactgttggg gccgtgcttg aggagcaggc cggcgacagc gatgccggcg agcgcggcgg 7800 

caccgttgaa caggctccgc tctcgccgat gttgcgggcc gcgatagacg ccttcgacga 7860 

agccggtccg gacgcagcgt tcgagcaggg actcgcggtg attgtcgatg gattggcgaa 7920 

aaggaggctc gttgtcagga acgttgaagg accgagaaag ggtgacgatt gatcaggacc 7980 

gctgccggag cgcaacccac tcactacagc agagccatgt agacaacatc ccctccccct 8040 

ttccaccgcg tcagacgccc gtagcagccc gctacgggct ttttcatgcc ctgccctagc 8100 
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gtccaagcct cacggccgcg ctcggcctct ctggcggcct tctggcgctc ttccgcttcc 8160 

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 8220 

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 8280 

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 8340 

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 8400 

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 8460 

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 8520 

ttccgctgca taaccctgct tcggggtcat tatagcgatt ttttcggtat atccatcctt 8580 

tttcgcacga tatacaggat tttgccaaag ggttcgtgta gactttcctt ggtgtatcca 8640 

acggcgtcag ccgggcagga taggtgaagt aggcccaccc gcgagcgggt gttccttctt 8700 

cactgtccct tattcgcacc tggcggtgct caacgggaat cctgctctgc gaggctggcc 8760 

ggctaccgcc ggcgtaacag atgagggcaa gcggatggct gatgaaacca agccaaccag 8820 

gaagggcagc ccacctatca aggtgtactg ccttccagac gaacgaagag cgattgagga 8880 

aaaggcggcg gcggccggca tgagcctgtc ggcctacctg ctggccgtcg gccagggcta 8940 

caaaatcacg ggcgtcgtgg actatgagca cgtccgcgag ctggcccgca tcaatggcga 9000 

cctgggccgc ctgggcggcc tgctgaaact ctggctcacc gacgacccgc gcacggcgcg 9060 

gttcggtgat gccacgatcc tcgccctgct ggcgaagatc gaagagaagc aggacgagct 9120 

tggcaaggtc atgatgggcg tggtccgccc gagggcagag ccatgacttt tttagccgct 9180 

aaaacggccg gggggtgcgc gtgattgcca agcacgtccc catgcgctcc atcaagaaga 9240 

gcgacttcgc ggagctggtg aagtacatca ccgacgagca aggcaagacc gagcgccttt 9300 

gcgacgctca ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca 9360 



WO 2004/063359 PCT/EP2004/000099 

332/357 

aacgcgccag aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga 9420 

tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 9480 

gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg 9540 

tggagctggc cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag 960 0 

atgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 9660 

actgacagat gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg 9720 

gcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 9780 

ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 9840 

ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 9900 

ggtgcccccc cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg 9960 

gctgcgcccc tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc 10020 

cattgccggg atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag 10080 

cattgacgtg ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg 10140 

cggcggcctg ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat 10200 

ggcggggccg gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct 10260 

cgtgttcggg ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg 10320 

aggtatgaaa acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa 10380 

agctaccaag acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac 10440 

aatactgata agataatata tcttttatat agaagatatc gccgtatgta aggatttcag 10500 

ggggcaaggc ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa 10560 

cttgcatgga ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca 10620 
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taattgggta atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac 10680 

tttgtcatgc agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag 10740 

gtgctgcctc agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac 10800 

gtgcagcttt cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac 10860 

cacgtcaaag ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc 10920 

gaatacgtgc gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg 10980 

gcgcgattta gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc 11040 

actgcccggc tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa 11100 

atcgtgttga ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg 11160 

gccatatcaa tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt 11220 

tgccatgttt tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg 11280 

ttacgcacca ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact 11340 

ggagcacctc aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat 11400 

tgtggtttca aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt 11460 

gaaaaagctg ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc 11520 

gtcttgttat aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat 11580 

aataaatggc taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct 11640 

gcgtaaaaga tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg 11700 

aaaacctata tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac 11760 

gggaaaagga catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact 11820 

ttgaacggca tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct 11880 
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cggaagagta tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca 11940 

tcaggctctt tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc 12000 

gcttagccga attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact 12060 

gggaagaaga cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa 12120 

agcccgaaga ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga 12180 

aagatggcaa agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt 12240 

atgacattgc cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg 12300 

agctattttt tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt 123 60 

tactggatga attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag 12420 

cgcaccgact tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat 12480 

ttgggcaagg ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag 12540 

gacggccaga cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc 12600 

aaggcaccag gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca 12660 

atcccgcaag gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg 12720 

atcgacgcgg ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt 12780 

gcgccccgcg aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc 12 840 

gagcgcgaca gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag 12900 

cgttcgcgtc gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg 12960 

cgaggaacta tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc 13020 

agcgaggcca agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag 13080 

ctttccttgt tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg 13140 
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gcccgctctg ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac 13200 

aaggtcattt tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg 13260 

gccgacgatg acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc 13320 

ggcgagccga tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat 13380 

ggccggtatt acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc 13440 

ttcacgtccg accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc 13500 

ctggaccgtg gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg 13560 

ctgtttgctg gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg 13620 

acggcccgac ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg 13680 

gaaaccttcc gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag 13740 

gtcggcgaag cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat 13800 

gatgacctgg tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca 13860 

gcagccagcg ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc 13920 

gctcagtatc gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa 13980 

aattgacaat tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt 14040 

tccgcgagat ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg 14100 

agcacgagga gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat 14160 

tcggcgccta catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc 14220 

ccaaggacgc tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc 14280 

gaggggtcgc cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg 14340 

tccgacagat tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata 14400 
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tttcgctatt ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg 14460 

cgacggtagg cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta 14520 

gcccgatacg attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt 14580 

tggtgttgac accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg 14640 

cggtttccat ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc 14700 

tcacctttac cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag 14760 

tgtttgatcc gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg 14820 

gcctgatcgg agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac 14880 

ctacagttgt ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga 14940 

tgcatcaggc cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg 15000 

ataggggagt tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc 15060 

agcggcttta tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt 15120 

cacggttaag cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga 15180 

tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga 15240 

gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac 153 00 

atgagcaaag tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg 15360 

ctgcctgtat cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct 15420 

ggtggcagga tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg 15480 

cggacgtttt taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg 15540 

attgcccttc accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc 15600 

cagcaggcga aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca 15660 
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aaagaatagc ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta 15720 

aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta 15780 

cgtgaaccat cacccaaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg 15840 

aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga 15900 

aaggaaggga agaaagcgaa aggagcgggc gccattcagg ctgcgcaact gttgggaagg 15960 

gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 16020 

gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 16080 

tgaattcgag ctcggtaccc ggg 16103 



<210> 63 

<211> 25 

<212> - DNA 

<213> Artificial 



<220> 

<223> -Primer 
<400> 63 

ggcgtacttg aaggaaccct taccg 25 



<210> 64 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



<400> 64 

attgatgctc ccggtcaccg tgatt 



25 
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<210> 65 
<211> 500 
<212> DNA 

<213> Blakeslea trispora 
<400> 65 

aatctataca atgctccata gactcacatt gatattgtcg aagatttcga tgctgactta 60 

gtagagcaac tacaaaagtt agcagagaag catgatttct taatctttga agaccgcaag 120 

tttgcagata tcggtatgtg aattctatct attttttttc tgatgtgtgc atggatgact 180 

catgatcata ttcttaggta atactgtcaa gcatcaatat ggcaagggcg tttacaagat 240 

tgcttcttgg tctcatatta ctaatgctca cacagttcct ggagaaggta ttatcaaggg 300 

acttgccgaa gtcggcctcc ctcttggtcg tggcttgctt ttgctagcag aaatgtcatc 360 

tcaaggtgca ttaactaagg gtatttacac tgccgaatct gtcaatatgg ctcgccgcaa 420 

caaagatttc gtttttggct ttattgcaca acacaaaatg aatcagtatg atgatgagga 480 

ttttgttgtc atgtcgcctg 500 

<210> 66 
<211> 611 
<212> DNA 

<213> Blakeslea trispora 
<400> 66 

gagattaaaa tagataagga aaagaaagtg aaaagaaatt cggaagcatg gcacattctt 60 
ctttttataa atacatgcct gactttctbt ttccatcgat atgatatatg catatgatag 120 
atatacaagc aatcttcttc aaggagtttg aaattttgtc ctccaggagc aaaaaaaagt 180 
ttttttttat acatgtttgt acacaagaat agttaccaat ttgctttggt cttacgtgct 240 
gcaagtttat atcgttttca atttctttgt ctttacattt tctttgtcct ttatctttcc 300 
tcatttagtc tttgggagaa ttaggaaaag ggagcggaaa ggtaagaaat gcttgcgtat 360 
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tttactaatt cggcaaacat ccaatttggc aaacagcagc ctgtgcaacg ctctcgagat 420 

gacagtatct ttgattacac tctaaatctc gatgacccga ccaaaaagag cgaacaaaga 480 

aataatcttg tgcattcgaa tatgatggaa gattttttcc cccttattct aaatgttgac 540 

atagcgtgta tgttatataa acaaaaagaa attgtacaaa ctttcttttc ttctcttttt 600 

attttatctc t 611 

<210> 67 
<211> 720 
<212> DNA 

<213> Blakeslea trispora 
<400> 67 

atgtcaatac tcacttatct ggaatttcat ctctactata cactacctgt ccttgcggca 60 

ttgtgttggc tgctaaagcc gtttcactca cagcaagaca atctcaagta taaattttta 120 

atgttgatgg ccgcctctac cgcatcgatt tgggacaatt atatcgttta tcatcgcgct 180 

tggtggtact gtcctacttg tgttgtggct gtcattggct atgtacctct agaagaatac 240 

atgttcttta tcatcatgac tttaatgact gtcgcgttct caaactttgt tatgcgttgg 300 

cacttgcata ctttctttat tagacccaac acttcttgga agcaaacact attagtacgc 3 60 

cttgtgcctg tttcagcttt attggcaatc acttatcatg cttggcactt gacactgcca 420 

aataaacctt cattttatgg ttcatgcatc ctttggtatg cttgtcctgt gttggctatt 480 

ctttggctgg gtgctggcga atatatcttg cgtcgacctg tggctgtcct tttgtctatt 540 

gttatcccta gtgtatacct atgttgggct gatatcgtcg ctattagtgc tggcacatgg 600 

catatttctc ttagaacaag cactggcaaa atggtagtac ccgatttacc tgtagaagaa 660 

tgcctgtttt ttactttgat caacacagtc ttggtttttg ctacctgtgc tatagaccgc 720 
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<210> 68 
<211> 1089 
<212> DNA 

<213> Blakeslea trispora 
<400> 68 

ctgtacaaat catctgttca aaatcaaaac cctaaacaag ccatttccct tttccagcat 60 

gtcaaagagc tagcatgggc cttctgtctfc cctgaccaaa tgctcaacaa tgaattgttt 120 

gatgatctta ctatcagctg ggatatttta cgtaaagcct caaagtcatt ctatactgca 180 

tctgccgttt ttccaagtta tgtacgtcaa gacttgggtg ttctctatgc tttctgcaga 240 

gctaccgatg acctgtgcga tgatgaatcc aaatctgttc aagaaagaag agaccaatta 300 

gatcttactc gacaatttgt tcgtgatctc tttagccaaa agaccagtgc gcctattgtg 360 

attgattggg aattgtatca aaaccaactt cctgcttctt gtatatcagc ctttagagcc 420 

tttactcgcc ttcgccatgt ccttgaagta gaccctgtag aagaactatt agatggttac 480 

aaatgggatc ttgagcgtcg tcctatcctt gatgaacaag acttggaggc atactctgct 540 

-tgtgtggcca gtagtgtggg tgaaatgtgc acacgtgtga ttcttgctca agaccaaaag 600 

gaaaatgatg cttggataat tgaccgtgca cgtgagatgg ggctggtgct acaatacgtt 660 

aacattgctc gagacattgt gactgatagc gagactctgg gtcgatgtta tctgcctcaa 720 

caatggctta gaaaagaaga aacagaacaa atacagcaag gcaacgcccg tagcctaggt 780 

gatcaaagac tgttgggctt gtctctgaag cttgtaggaa aggcagacgc tatcatggtg 840 

agagctaaga agggcattga caagttgccg gcaaactgtc aaggcggtgt acgagctgct 900 

tgccaagtat atgctgcaat tggatctgta ctcaagcagc agaagacaac atatcctaca 960 

agagctcatc taaaaggaag cgaacgtgcc aagattgctc tgttgagtgt atacaacctc 1020 

tatcaatctg aagacaagcc tgtggctctc cgtcaagcta gaaagattaa gagttttttt 1080 
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gttgattag 1089 



<210> 69 
<211> 611 
<212> DNA 

<213> Blakeslea trispora 
<400> 69 

agagataaaa taaaaagaga agaaaagaaa gtttgtacaa tttctttttg tttatataac 60 

atacacgcta tgtcaacatt tagaataagg gggaaaaaat cttccatcat attcgaatgc 12 0 

acaagattat ttctttgttc gctctttttg gtcgggtcat cgagatttag agtgtaatca 180 

aagatactgt catctcgaga gcgttgcaca ggctgctgtt tgccaaattg gatgtttgcc 240 

gaattagtaa aatacgcaag catttcttac ctttccgctc ccttttccta attctcccaa 300 

agactaaatg aggaaagata aaggacaaag aaaatgtaaa gacaaagaaa ttgaaaacga 360 

tataaacttg cagcacgtaa gaccaaagca aattggtaac tattcttgtg tacaaacatg 420 

tataaaaaaa aacttttttt tgctcctgga ggacaaaatt tcaaactcct tgaagaagat 480 

tgcttgtata tctatcatat gcatatatca tatcgatgga aaaagaaagt caggcatgta 540 

tttataaaaa gaagaatgtg ccatgcttcc gaatttcttt tcactttctt ttccttatct 600 



attttaatct c 



<210> 70 

<211> 882 

<212> DNA 

<213> Haematococcus pluvialis 



611 



<400> 70 

atgctgtcga agctgcagtc aatcagcgtc aaggcccgcc gcgttgaact agcccgcgac 



afccacgcggc ccaaagtctg cctgcatgct cagcggtgct cgttagttcg gctgcgagtg 



60 
120 
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gcagcaccac agacagagga ggcgctggga accgtgcagg ctgccggcgc gggcgatgag 180 

cacagcgccg atgtagcact ccagcagctt gaccgggcta tcgcagagcg tcgtgcccgg 240 

cgcaaacggg agcagctgtc ataccaggct gccgccattg cagcatcaat tggcgtgtca 300 

ggcattgcca tcttcgccac ctacctgaga tttgccatgc acatgaccgt gggcggcgca 360 

gtgccatggg gtgaagtggc tggcactctc ctcttggtgg ttggtggcgc gctcggcatg 420 

gagatgtatg cccgctatgc acacaaagcc atctggcatg agtcgcctct gggctggctg 480 

ctgcacaaga gccaccacac acctcgcact ggaccctttg aagccaacga cttgtttgca 540 

atcatcaatg gactgcccgc catgctcctg tgtacctttg gcttctggct gcccaacgtc 600 

ctgggggcgg cctgctttgg agcggggctg ggcatcacgc tatacggcat ggcatatatg 660 

tttgtacacg atggcctggt gcacaggcgc tttcccaccg ggcccatcgc tggcctgccc 720 

tacatgaagc gcctgacagt ggcccaccag ctacaccaca gcggcaagta cggtggcgcg 780 

ccctggggta tgttcttggg tccacaggag ctgcagcaca ttccaggtgc ggcggaggag 840 

gtggagcgac tggtcctgga actggactgg tccaagcggt ag 882 

<210> 71 
<211> 528 
<212> DNA 

<213> Erwinia uredovora 
<400> 71 

atgttgtgga tttggaatgc cctgatcgtt ttcgttaccg tgattggcat ggaagtgatt 60 

gctgcactgg cacacaaata catcatgcac ggctggggtt ggggatggca tctttcacat 120 

catgaaccgc gtaaaggtgc gtttgaagtt aacgatcttt atgccgtggt ttttgctgca 180 

ttatcgatcc tgctgattta tctgggcagt acaggaatgt ggccgctcca gtggattggc 240 
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gcaggtatga cggcgtatgg attactctat tttatggtgc acgacgggct ggtgcatcaa 300 

cgttggccat tccgctatat tccacgcaag ggctacctca aacggttgta tatggcgcac 360 

cgtatgcatc acgccgtcag gggcaaagaa ggttgtgttt cttttggctt cctctatgcg 420 

ccgcccctgt caaaacttca ggcgacgctc cgggaaagac atggcgctag agcgggcgct 480 

gccagagatg cgcagggcgg ggaggatgag cccgcatccg ggaagtaa 528 

<210> 72 
<211> 762 
<212> DNA 

<213> Nostoc sp. PCC73102 
<400> 72 

atgatccagt tagaacaacc actcagtcat caagcaaaac tgactccagt actgagaagt 60 

aaatctcagt ttaaggggct tttcattgct attgtcattg ttagcgcatg ggtcattagc 120 

ctgagtttat tactttccct tgacatctca aagctaaaat tttggatgtt attgcctgtt 180 

atactatggc aaacattttt atatacggga ttatttatta catctcatga tgccatgcat 240 

ggcgtagtat ttccccaaaa caccaagatt aatcatttga ttggaacatt gaccctatcc 300 

ctttatggtc ttttaccata tcaaaaacta ttgaaaaaac attggttaca ccaccacaat 360 

ccagcaagct caatagaccc ggattttcac aatggtaaac accaaagttt ctttgcttgg 420 

tattttcatt ttatgaaagg ttactggagt tgggggcaaa taattgcgtt gactattatt 480 

tataactttg ctaaatacat actccatatc ccaagtgata atctaactta cttttgggtg 540 

ctaccctcgc ttttaagttc attacaatta ttctattttg gtactttttt accccatagt 600 

gaaccaatag ggggttatgt tcagcctcat tgtgcccaaa caattagccg tcctatttgg 660 

tggtcattta tcacgtgcta tcattttggc taccacgagg aacatcacga atatcctcat 720 

atttcttggt ggcagttacc agaaatttac aaagcaaaat ga 762 
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<210> 73 
<211> 617 
<212> DNA 

<213> Haematococcus pluvialis 
<400> 73 

tagggtgcgg aaccaggcac gctggtttca cacctcatgc ctgtgataag gtgtggctag 60 

agcgatgcgt gtgagacggg tatgtcacgg tcgactggtc tgatggccaa tggcatcggc 120 

catgtctggt catcacgggc tggttgcctg ggtgaaggtg atgcacatca tcatgtgcgg 180 

ttggaggggc tggcacagtg tgggctgaac tggagcagtt gtccaggctg gcgttgaatc 240 

agtgagggtt tgtgattggc ggttgtgaag caatgactcc gcccatattc tatttgtggg 3 00 

agctgagatg atggcatgct tgggatgtgc atggatcatg gtagtgcagc aaactatatt 360 

cacctagggc tgttggtagg atcaggtgag gccttgcaca ttgcatgatg tactcgtcat 420 

ggtgtgttgg tgagaggatg gatgtggatg gatgtgtatt ctcagacgta gaccttgact 480 

ggaggcttga tcgagagagt gggccgtatt ctttgagagg ggaggctcgt gccagaaatg 540 

gtgagtggat gactgtgacg ctgtacattg caggcaggtg agatgcactg tctcgattgt 600 

aaaatacatt cagatgc 617 

<210> 74 
<211> 1208 
<212> DNA 

<213> Haematococcus pluvialis 
<400> 74 

attgtgactg atagcgagac tctgggtcga tgttatctgc ctcaacaatg gcttagaaaa 60 
gaagaaacag aacaaataca gcaaggcaac gcccgtagcc taggtgatca aagactgttg 120 
ggcttgtctc tgaagcttgt aggaaaggca gacgctatca tggtgagagc taagaagggc 180 
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attgacaagt tgccggcaaa ctgtcaaggc ggtgtacgag 

gcaattggat ctgtactcaa gcagcagaag acaacatatc 

ggaagcgaac gtgccaagat tgctctgttg agtgtataca 

aagcctgtgg ctctccgtca agctagaaag attaagagtt 

tttgttttat ttatgtctga tagttcaata aagagacaac 

gtctttaaat gttaatttag tagagtgtaa agcctgcatt 

tgaattcacc ccgcttctgg tttttaaata attatgtcaa 

ttctcttcgt tctttttttg gcttgttgtg gagtcacagg 

ggttgtatac actcaacaga gcaatcttgg cacgttcgct 

taggatatgt tgtcttctgc tgcttgagta cagatccaat 

cagctcgtac accgccttga cagtttgccg gcaacttgtc 

ccatgatagc gtctgccttt cctacaagct tcagagacaa 

ctaggctacg ggcgttgcct tgctgtattt gttctgtttc 

gaggcagata acatcgaccc aacatcctcg agccatacta 

tctttaacag aaatttaccc ttttgttatc agcacataca 

gagtaggact tccattctct caaaaatttt attcaatcca 

aaaaaagaaa gattatgcct gattttctct attttttttt 
ctttctag 

<210> 75 
<211> 6316 
<212> DNA 

<213> Blakeslea trispora 
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ctgcttgcca agtatatgct 240 

ctacaagagc tcatctaaaa 3 00 

acctctatca atctgaagac 360 

tttttgttga ttagtgaatt 420 

acatacaata taaaatcatt 480 

ttttttgtac gcataaacaa 540 

actagggaaa attctttttt 600 

cttgtcttca gattgataga 660 

tccttttaga tgagctcttg 720 

tgcagcatat acttggcaag 780 

aatgcccttc ttagctctca 840 

gcccaacagt ctttgatcac 900 

ttcttttcta agccattgtt 960 

cagcataaaa ggatacgttt 1020 

aaaaaaaaga aatttaagat 1080 

taaatgaatt atttttggac 1140 

tttttacaac tccaccaata 1200 

1208 
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<220> 

<221> misc_feature 

<222> (2694) . . (2694) 

<223> n is a, c, g, or t 

<220> 

<221> misc_feature 

<222> (4263) . . (4263) 

<223> n is a, c, g, or t 

<400> 75 

aaggatgaag aatccaactc taataaaaat cttatggata tctttgatcg actcaaaaag 60 

gctttcaatg ctattgctat taaaaaaaaa gagagagaga gaactatgag caaaaggact 120 

ctatgccaag atggcaaaaa ggcaccagaa acccttagtt tattattgca taatccagtc 180 

gagctagtac ttctgtagct caagcttaac cgaggatctt ggaatcaact cgtctcgtca 240 

ctcttgccga tgatcctaga aatggtatct atggatgtta tactaacatt gttatctttc 300 

aaggcctcga agatgttatt gttgcggtga taaataggct gctatgtact gaagttgctc 360 

tgtaaaatga atctagttca ctgcctactc agcaaatggt tgtttctaat gtctttaaag 420 

aaagaaaaaa agatacatat agactaccct tcctttcaag actgtaatcg agaatcggcc 480 

gatggtttat tacaattaga cgctgggaat aagcaaaagg attcatcttt gtaaataaga 540 

gactggtgca tatgaaagca aggatcgtat caaggaatag ttttgatcga gcatcaccag 600 

caaatgctgc taatgttggc ttcttctttg cttcctgaga ttgaatggga tgtgcctaga 660 

gcattgctat ttttaagtgt atactttaga tttgtgtctt tagatttgtg tcattttatt 720 

tagtcaagaa agatccccct ttctctatgt atgctaagaa gaaggagcaa gaagtgtatt 780 

tacaagttgg aatgagattg aaatattgta cataataata ataaaaagaa aggtagatca 840 

aaaaaaatgt tctgcctatt gtaagaaatc gggaccaaca ggtgcttgat aaccagaagt 900 
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agcttccaat tcaggtagag gctctaggga caaatacaca attatgacag gaattttctt 960 

gttgacttga acactacaag agaaacgggt cagcacaaaa tccgaaaaaa aaaagaaacg 1020 

gaccattcat gtcttaccta tctagctctt tgtcttcaat tgcatcccat tgctcaacca 1080 

cagatacgct tcccaattga" gtatattgat gaagtgttcc ctgcattttt cgcttgacta 1140 

attccactac agtcacagtc ttattaatgt tttgtccttt accagtcagg ataatatgat 1200 

ctttttgctt cttctatcaa aaaaataatt cttgttttga ataaaaaaaa caaatattta 1260 

aagaaactac tttgatgacg gtacctggaa taactcgaga cacacatcta catatgcgtt 1320 

gattttattg tggctaattc gaacctcatt ttctgctggt gggggctgtt gactttcagt 1380 

tgctgagacg tccttcttgc ttcttttata gtcttccact atgattttaa tcaagaaagt 1440 

aagtcagtga tgattgttac aagctatata tcttgaaaaa gaacagagag gtattattat 1500 

cagatgcaac atggttttct gtatcatttt catttcagtt tctctgttca aaaaaaaaaa 1560 

gaacactttc tctttccact cctcaaattt tttctgctaa actcctcgca aaacatgtat 1620 

ttgctttaaa ctacaagttg caattgtctg atttagcaat ttcaatatgc cttttgtgaa 1680 

tccacccaaa aataaacaag tgcttgagta tacttgggtt cagttcaaaa gaaagcaagc 1740 

tttttttttt ctttcttggg aaagaaaaaa aaatattgtt gagccatcct ttaccagcag 1800 

tatgcgagct acgacatagc tggtctaaca atgactgcaa gcaatagatc gagcttagtc 1860 

tttctattgc ttcyttgttt gatctatgtt cggccttacg ctgacctatc caatactcga 1920 

gataggcaac aagatttcga acagtaatga aataaatttc ggataacagt tgtggatgag 1980 

gaagagaaag cgacttgaac tcgagaaact ttgttgaaat gaaatccgac cttttacgtg 2040 

atcatcatgt attatcctct ttttcttttt tttcgtagtg aattacttac tgattgcgct 2100 

caagtcgcgt ctttataaag aagaaaaaaa aatattagaa ctttcaaaaa atataactga 2160 
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aaataaaagt gtggctcgga gagcaaatac cacatccttt gtcttcgctt tggtaacacg 2220 

gttaataagc cactataggt gaataatgat catttctgag aataaagcgc ggcttgaagc 2280 

ttatatccat atcaggattc atattaggca caactcacaa ttgaggttcc agaagtgcca 2340 

attttttttt cctgatagcc tgtccaatta agatcaaaaa ccactgagtt ttctctatat 2400 

attttttttt ttcataattc ttaactcttc ttcctctctc tctctctctc tctctttttg 2460 

gcttgcaaaa aaaatcttta gtaataccaa agaaagcaaa ccttttcctt ttcttatttc 2520 

cttgcttgtt ttttaatttt tgatttctct atgctttaaa tacccatttc tttctttctt 2580 

ctgctattac ctatcttttc attcctctcc cccctctctc tcttggtcta taaacatcat 2640 

gaagtcctct tttaaaagtt cgcttgacat ttatgctgtt tatatacagc atcntgtgtt 2700 

ttccaagtgg ttcattcttg cttttgttct ttcgattttc ctcaacactt atctactgaa 2760 

cgcttcgaag caacagccca aagtgataat caaaaaggtt attgagcggg tagaagtacc 2820 

aagtagagaa caacctaaat cagtcataaa gccctcctcc aagaaacact cttctcatca 2880 

tcagtctgat gtcattcgcc ctcttgatga agtattgggt ttgctcggaa cacccgaggc 2940 

cttgactgat gaagagatca tctctattgt tcaagctggt aaaatggccc cctatgctct 3000 

tgaaaaggtc ttgggcgatt tagagcgcgc tgtccatatc cgtcgtgctt tgatctcccg 3060 

tgactctcgt acgaaaactt tggaagacag tatgcttccc gtgaaaaact atcattatga 3120 

taaagtcatg ggtgcttgtt gtgaaaatgt cattggttat atgcctattc cagtaggtgt 3180 

cgcaggtaag aagttcaaca agtcgcgata tttgacaagt tgctcatcat tttcgaaaca 3240 

ggtcctttgg tgattgatgg tgattctatt catattccca tggcaactac ggaaggttgt 3300 

ttagttgctt ctactgccag aggttgtaaa gcaatcaatg ctggtggtgg tgccaacaca 3360 

attgttgttg ctgatggtat gactcgaggt ccttgtgtcg aatttcctac aatcactcgc 3420 
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gctgctgact gtaaacgatg gattgaacaa 
aattcaactt ctcgttttgc tcgtgttcgt 
gtctacatcc gtttctctac cactacaggt 
ggttgtgaaa aggctttaag caagattgct 
ctttctggta actattgtac tgacaagaaa 
ggtaaatctg ttgttgctga sgctgtcatc 
acctctgtta gtgctttggt tgagctgaac 
gctggctccg tcggtggctt taacgctcat 
gctactggtc aagatcctgc tcaaaatgta 
gctgtcaatg gcgaaagaga ccttcatatc 
accattggtg gtggtactat tttgcctcct 
cgtggtcctc accctaccga acctggtgcc 
gcctctgtga tggctggtga attgtcttta 
aaggcacaca tggctcataa tcgtaatacc 
aanggcatag ttgatgtctc tacacctcct 
cctggaagtt gtatcaagtc atagaattaa 
aaaaaaaaaa cactacatct atttatattt 
aaactcttta ttttccaata ttttgctttt 
tgtttttttt tattaatcat caaaccctgc 
atggtttaac tctggtatcg gwcgagcctc 
atttaaggct gctggtcgat catgatcatc 
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gagggtgaag ctatcgtgac cgaggcattc 3480 

aaattgaaag ttgctcttgc cggtcgtcta 3540 

gatgcaatgg gcatgaacat gatctccaag 3600 

gagagatatc ctgatatgca gatcatttct 3660 

cctgctgcta tcaactggat tgaaggacgt 3720 

cctggtacgg ttgtcgaaaa ggtattgaag 3780 

atctctaaaa acctggttgg ttctgctatg 3840 

gctgctaata ttctaactgc catttacctt 3900 

sagagttcta actgtattac tttgatgaaa 3960 

tcttgtacaa tgccctgtat tgaagtaggc 4020 

caacaagcca tgttggattt cattggtgtg 4080 

aatgcccgwc gccttgctcg tgttatctgt 4140 

tgtgcagctt tggctgctgg tcatcttgta 4200 

actgctgctg ccgctgttgt tcctgcccct 4260 

gctacacctg cagaaaagaa tga'tcctatt 432 0 

tattatatat atatcatata caaaaaaaag 4380 

ctccatgtac acacacacac acacatataa 4440 

ataaataatc ttatttcatt ctaaataaac 4500 

tgagagctgt gcaatatcat ctatgttttc 4560 

ctctgtactt gaagtttgta ggcagttttt 4620 

akcaaacctg acagcatgaa gttttgactg 4680 
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atgagcaatt tcactaaggg cagaatctga actctttcgc ttcctactat tgaccatatt 4740 

gtctttaggt ggaatgagtg aatagcgtct tgtcatatgt aacacagaat caacaatatc 4800 

ctggtgatga aactcggcca aacatagcgc ctttctcccc caacaattat aataatcaaa 4860 

atgagaatga catgtacggt tttcctcgat gacaatatcc aacgtcttgt cataatcctc 4920 

tgtgcgyata ccattcatct tttggaagaa cgcacggtag ctctcacaag ctgtcctcag 4980 

agagttccgt gccatgtttc ccaatgctcc tggcaagtcg aaatgaagtt gtcgaatctg 5040 

gcgatgtatg tctacaatgt cgcctgtttc tttcattaga tcaagcattc gtgtagccca 5100 

aatgatgtct atgttatgat tttctttcat tccagtaata actatagttt ctcggcaaat 5160 

cgaatgastg atggagtaaa ttcatcaaaa gtgcaagtaa tacatacagt gcttgaagaa 5220 

atcttgtgta gcacgcctat attatgtaat ataggatcga ttctcgaaac tcgacataac 5280 

caccaggctt tagcaagcgt tttatttcat tcatgacaag ctattgttaa ttcytgctta 5340 

ataaaacaaa atgaaaaaaa catacccccc tcmaaactta cttcccactc ttgattggaa 5400 

aaacaggtat agacgtgacg catatgtata taatcaaaac actcatcagg atagggtaaa 5460 

ccattgagca catcgcattg ggtgaagaaa gtattaggag gcttgatggc tgtaggatat 5520 

ataggtgcaa tatcaatacc gtaaaactca gcatttggga attctgtagc catctccaga 5580 

atccaagtac ctgtgccaca agcaacatca agcactttag gtaagggtat acattgttgt 5640 

tcttgttgtt gttgttgaca atcacttgag tctgagtttc gttttgattg ttttaatgac 5700 

aataattctt ttacaggtgc tgagaaatta ccgtcaaata gatacttgta aataaaatgc 5760 

taaaaataaa aacaatagaa aaaaaaattg acgctcattt cattactatg gaaataactg 5820 

caaaatctta ccacttgtac aagtctatct tgctcaatct catcgtttgg cagaatgtat 5880 

ttattgttgt agtattgata tcttctacca ttcatgatat aactgtcgct tctaatgctc 5940 



WO 2004/063359 PCT/EP2004/000099 

351/357 



tgaggtgaag tacttgtagg tgaaggtgga agtgacgcaa ttttgtcaag cttaacagga 6000 

tcctctcggc tacatgtttt ctgcatatca ggaaaatctt gtttatttga aacatcaaca 6060 

gtagatgtgg tgtgatcttt tttgaaaata tcgatgcctt cctttgaaag ccttttgaaa 6120 

ggctctttta acttttttga gtgagagcta cccatgatag cttatgaaga attaaaaaga 6180 

aaaaagcaaa aaaaattaaa aaaaaaaaaa gtagcaaaaa attctgtcgt aattatacaa 6240 

gccaatcaaa atcgaaattc atgcaaggca tagatgttca cgtggatttg atggttgatc 6300 

cttttttttt gcaaga 6316 

<210> 76 
<211> 1170 
<212> DNA 

<213> Thermus thermophilics 
<400> 76 

atgaagcgcc tttccctgag ggaggcctgg ccctacctga aagacctcca gcaagatccc 60 

ctcgccgtcc tgctggcgtg gggccgggcc cacccccggc tcttccttcc cctgccccgc 120 

ttccccctgg ccctgatctt tgaccccgag ggggtggagg gggcgctcct cgccgagggg 180 

accaccaagg ccaccttcca gtaccgggcc ctctcccgcc tcacggggag gggcctcctc 240 

accgactggg gggaaagctg gaaggaggcg cgcaaggccc tcaaagaccc cttcctgccg 300 

aagaacgtcc gcggctaccg ggaggccatg gaggaggagg cccgggcctt cttcggggag 360 

tggcgggggg aggagcggga cctggaccac gagatgctcg ccctctccct gcgcctcctc 420 

gggcgggccc tcttcgggaa gcccctctcc ccaagcctcg cggagcacgc ccttaaggcc 480 

ctggaccgga tcatggccca gaccaggagc cccctggccc tcctggacct ggccgccgaa 540 

gcccgcttcc ggaaggaccg gggggccctc taccgcgagg cggaagccct catcgtccac 600 
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ccgcccctct cccaccttcc ccgagagcgc gccctgagcg aggccgtgac cctcctggtg 660 

gcgggccacg agacggtggc gagcgccctc acctggtcct ttctcctcct ctcccaccgc 720 

ccggactggc agaagcgggt ggccgagagc gaggaggcgg ccctcgccgc cttccaggag 780 

gccctgaggc tctacccccc cgcctggatc ctcacccgga ggctggaaag gcccctcctc 840 

ctgggagagg accggctccc cccgggcacc accctggtcc tctcccccta cgtgacccag 900 

aggctccact tccccgatgg ggaggccttc cggcccgagc gcttcctgga ggaaaggggg 960 

accccttcgg ggcgctactt cccctttggc ctggggcaga ggctctgcct ggggcgggac 1020 

ttcgccctcc tcgagggccc catcgtcctc agggccttct tccgccgctt ccgcctagac 1080 

cccctcccct tcccccgggt cctcgcccag gtcaccctga ggcccgaagg cgggcttccc 1140 

gcgcggccta gggaggaggt gcgggcgtga 1170 

<210> 77 
<211> 2981 
<212> DNA 

<213> Blakeslea trispora 
<400> 77 

tctagaattc attccattcg aaaggatcaa cataaccaat ttaatgacta ctagctaatg 60 

gatacaaata tacgcacaaa aaaagaaaga attctatgat caaagagaac acagacacag 120 

agtgatacat ttaaatggtt aagttcttat gatgttaaaa tggtaacttt attattgaat 180 

taaatgcgaa tatcgttgct gctttgtact tggaaaacgt taggtaaaag ttggttaatg 240 

aaagaagcag gagttgtagt atcatctctt gggaagaaat agaaaaagag gaaagtaaca 300 

aagtaacaag caagacaata atagatccaa tggctttcgg tcttacgagt ttgttcagga 360 

gcatacttct tttggctatc ttgtaacttt cttggtaagg gattctggcc aaagctttta 420 

cagacttggt cggaagtaag cttacttcca gcaagaacga taggaacacc agtacctgga 480 
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tgtgtactac aaagaaaaga gaaatgagta 
ggcaaaagta ttacctagct ccgacaaaga 
tggtactagg tctgaaccag agaacttgga 
ctctccaaag gttaaacttg ctttgccaaa 
tcaaattagc aaagttgttt actcccaaac 
gtgcacggtt taccaactca ggataatttt 
tatggccaat tggaaccaac acaataatgg 
caattcgaga tggaacgttg acatagaatg 
aaatctcatc aaaactttcc ttgtaggctt 
gaggcacctt tgttgacatg gaccaataaa 
aggctaatgt cttctttgtc caattgcaag 
gatccgcatt acatacgact gcatcggctt 
cggttacacg cttgtcttta tcgacagtgt 
attcagcacc gtactttttg gaggcgatag 
caccacgagg ataccagata ccttcagcaa 
ctggagcatc ataaggcgac atactatatt 
aaaattcctt tcacttgccc tttttcacat 
tcattttttt ttcatcccac accacgcgtt 
gaaaagtaaa agccatacgc attttcttgg 
tcttaccaaa caagtgcaag cgaaagattt 
aaatggtttc aaagttgcgc ttgatagcaa 
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cgtgcgttat taaaaaaaag aaaaaaagag 540 
aaagattatc ataacggttt gtggaatcct 600 
acacatcatg agaaagacca agaatagaac 660 
cactaggatc attcacttct tcatgttcaa 720 
gacgttcgat aacttccaga accatcttgc 780 
cttcagcact gtttcctgtc ttactcttca 840 
agtccttgtt gggaggtgcg gcagattcat 900 
aagcttcaga gggcaaaccg aagtcgttga 960 

cagccaagaa gatattgtgt acgtctaatt 1020 

acgaaataga tgatgaagtg agtttctttg 1080 

gaggtaacag atggtgataa gcataaacaa 1140 

caatgacttc tccgctttcc aaagtgacac 1200 

taattttagc aacaggcgat tgatatctga 1260 

actcaagctt ctgaacaacc atgttgaaac 1320 

actcggtgta ttgtaacaaa ctgtaaactg 1380 

ccaaaaatag aaaatagaac aatgaatatc 1440 

ttctcttttc ccacccccga ccggtctcac 1500 

gtatgtgtac ttaccccata tacattgttt 1560 

tttggaaata tttactggct cggtcataga 1620 

caggcacata ctgaagacga atcaaatccc 1680 

taaatgtacc ttgttcataa tggacatgtg 1740 
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tttccttcat gaaatccaag aatctaccaa atccaagggg accctcaata cggtccaatt 1800 

cgcccttcat cttggttaaa tcggaagaga gttgtacggc atcaccgtcg tcaaaatgaa 1860 

ccttatagtt attgtcacag cgaagcaaat ccaaatgatc accaatacgt tcatccaaat 1920 

cagcaaatgc atcttcaaaa agcttaggca tcaaafcagag tgagggaccc tgatcaaagc 1980 

gatgaccatc gtgatgaatg aatgaacaac ggccaccgga aaagtcgttc ttttcaacaa 2040 

cagtaactcg aaaaccttca cgagcaagac gagcagcagt agcagttccg ccaataccgg 2100 

caccaatgac aacaatatgc ttcttttgat cagacatgag attaaaatag ataaggaaaa 2160 

gaaagtgaaa agaaattcgg aagcatggca cattcttctt tttataaata catgcctgac 2220 

tttctttttc catcgatatg atatatgcat atgatagata tacaagcaat cttcttcaag 2280 

gagtttgaaa ttttgtcctc caggagcaaa aaaaagtttt tttttataca tgtttgtaca 2340 

caagaatagt taccaatttg ctttggtctt acgtgctgca agtttatatc gttttcaatt 2400 

tctttgtctt tacattttct ttgtccttta tctttcctca tttagtcttt gggagaatta 2460 

ggaaaaggga gcggaaaggt aagaaatgct tgcgtatttt actaattcgg caaacatcca 2520 

atttggcaaa cagcagcctg tgcaacgctc tcgagatgac agtatctttg attacactct 2580 

aaatctcgat gacccgacca aaaagagcga acaaagaaat aatcttgtgc attcgaatat 2640 

gatggaagat tttttccccc ttattctaaa tgttgacata gcgtgtatgt tatataaaca 2700 

aaaagaaatt gtacaaactt tcttttcttc tctttttatt ttatctctat gtcaatactc 2760 

acttatctgg aatttcatct ctactataca ctacctgtcc ttgcggcatt gtgttggctg 2820 

ctaaagccgt ttcactcaca gcaagacaat ctcaagtata aatttttaat gttgatggcc 2880 

gcctctaccg catcgatttg ggacaattat atcgtttatc atcgcgcttg gtggtactgt 2940 

cctacttgtg ttgtggctgt cattggctat gtacctctag a 2981 
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<210> 78 
<211> 1749 
<212> DNA 

<213> Blakeslea trispora 
<400> 78 

atgtctgatc aaaagaagca tattgttgtc attggtgccg gtattggcgg aactgctact- 60 

gctgctcgtc ttgctcgtga aggttttcga gttactgttg ttgaaaagaa cgacttttcc 120 

ggtggccgtt gttcattcat tcatcacgat ggtcatcgct ttgatcaggg tccctcactc 180 

tatttgatgc ctaagctttt tgaagatgca tttgctgatt tggatgaacg tattggtgat 240 

catttggatt tgcttcgctg tgacaataac tataaggttc attttgacga cggtgatgcc 300 

gtacaactct cttccgattt aaccaagatg aagggcgaat tggaccgtat tgagggtccc 360 

cttggatttg gtagattctt ggatttcatg aaggaaacac atgtccatta tgaacaaggt 42 0 

acatttattg ctatcaagcg caactttgaa accatttggg atttgattcg tcttcagtat 480 

gtgcctgaaa tctttcgctt gcacttgttt ggtaagatct atgaccgagc cagtaaatat 540 

ttccaaacca agaaaatgcg tatggctttt acttttcaaa caatgtatat gggtatgtcg 600 

ccttatgatg ctccagcagt ttacagtttg ttacaataca ccgagtttgc tgaaggtatc 660 

tggtatcctc gtggtggttt caacatggtt gttcagaagc ttgagtctat cgcctccaaa 720 

aagtacggtg ctgaattcag atatcaatcg cctgttgcta aaattaacac tgtcgataaa 780 

gacaagcgtg taaccggtgt cactttggaa agcggagaag tcattgaagc cgatgcagtc 840 

gtatgtaatg cggatcttgt ttatgcttat caccatctgt tacctccttg caattggaca 900 

aagaagacat tagcctcaaa gaaactcact tcatcatcta tttcgtttta ttggtccatg 960 

tcaacaaagg tgcctcaatt agacgtacac aatatcttct tggctgaagc ctacaaggaa 102 0 
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agttttgatg agattttcaa cgacttcggt ttgccctctg aagcttcatt ctatgtcaac 1080 

gttccatctc gaattgatga atctgccgca cctcccaaca aggactccat tattgtgttg 1140 

gtfcccaattg gccatatgaa gagtaagaca ggaaacagtg ctgaagaaaa ttatcctgag 1200 

ttggtaaacc gtgcacgcaa gatggttctg gaagttatcg aacgtcgttt gggagtaaac 1260 

aactttgcta atttgattga acatgaagaa gtgaatgatc ctagtgtttg gcaaagcaag 1320 

tttaaccttt ggagaggttc tattcttggt ctttctcatg atgtgttcca agttctctgg 13 80 

ttcagaccta gtaccaagga ttccacaaac cgttatgata atcttttctt tgtcggagct 1440 

agtacacatc caggtactgg tgttcctatc gttcttgctg gaagtaagct tacttccgac 1500 

caagtctgta aaagctttgg ccagaatccc ttaccaagaa agttacaaga tagccaaaag 1560 

aagtatgctc ctgaacaaac tcgtaagacc gaaagccatt ggatctatta ttgtcttgct 1620 

tgttactttg ttactttcct ctttttctat ttcttcccaa gagatgatac tacaactcct 1680 

gcttctttca ttaaccaact tttacctaac gttttccaag tacaaagcag caacgatatt 1740 

cgcatttaa 17aq 



<210> 79 

<211> 25 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 79 

ccgatggcga cgacggaagg ttgtt 

<210> 80 

<211> 25 

<212> DNA 
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<213> Artificial 



<220> 

<223> Primer 



<400> 80 

catgttcatg cccattgcat cacct 



25 



